1.El auge de DeepSeek: la IA revoluciona el mercado Global

Liang Wenfeng, un nombre relativamente desconocido fuera de los círculos financieros de China, se ha convertido en una figura importante en el panorama mundial de la IA. Su trayectoria desde que cofundó el fondo de cobertura cuantitativo High-Flyer hasta encabezar el desarrollo de DeepSeek, un modelo de IA con el potencial de remodelar la industria de la IA, es una historia de innovación, previsión estratégica y disrupción del mercado.

Liang Wenfeng: el arquitecto del trading impulsado por la IA

Nacido en 1985 en Zhanjiang, Guangdong, el viaje de Liang Wenfeng al mundo de las finanzas y la tecnología comenzó con humildes comienzos. Hijo de maestros de primaria, cursó su formación en la Universidad de Zhejiang, donde obtuvo una licenciatura y un máster en Ingeniería, especializándose en ingeniería de la información y las comunicaciones. Su interés por los mercados financieros surgió durante la crisis financiera de 2007-2008, cuando él y sus compañeros de clase comenzaron a acumular datos financieros y a explorar estrategias de trading cuantitativas utilizando el aprendizaje automático.

Los primeros intentos de Liang de aplicar la IA a varios campos fracasaron, un testimonio de los desafíos de ser pioneros en nuevas tecnologías. Sin embargo, su persistencia lo llevó a explorar el potencial de la IA en las finanzas, donde finalmente encontró el éxito. En 2013, cofundó Hangzhou Yakebi Investment Management Co Ltd, marcando su primera incursión en la integración de la IA con el comercio cuantitativo. Esta experiencia sentó las bases para sus futuros emprendimientos, que culminaron con el establecimiento de High-Flyer en 2016.

High-Flyer: pionero en el trading cuantitativo impulsado por IA

High-Flyer, cofundado por Liang y dos de sus compañeros de clase, se distinguió como un fondo de cobertura cuantitativo que dependía en gran medida de la IA y los modelos matemáticos para impulsar sus estrategias de inversión. La filosofía central de la empresa giraba en torno a la automatización de las decisiones de inversión, eliminando el papel de los gestores de carteras humanos y confiando únicamente en servidores impulsados por IA. El 30 de agosto de 2019, Liang pronunció un discurso de apertura titulado “El futuro de la inversión cuantitativa en China desde la perspectiva de un programador” en la ceremonia de los Golden Bull Awards, donde articuló esta visión y provocó debates sobre el futuro de las finanzas.

El compromiso de High-Flyer con la IA se extendió más allá de sus estrategias comerciales. La firma estableció “Fire-Flyer I” en 2020, una supercomputadora dedicada al aprendizaje profundo de IA, que costó aproximadamente 200 millones de yuanes. A esto le siguió “Fire-Flyer II” en 2021, una supercomputadora más potente que cuesta 1 mil millones de yuanes y está equipada con 10,000 GPU Nvidia A100 . Estas inversiones en infraestructura de IA pusieron de manifiesto la dedicación de High-Flyer a ampliar los límites del comercio cuantitativo impulsado por la IA.

Las estrategias de inversión de High-Flyer se construyeron sobre una base de análisis de datos exhaustivos y aprendizaje automático. La empresa acumuló grandes cantidades de datos financieros, incluidos datos de cotizaciones y ticks, datos de inversión y datos macroeconómicos, superando los 10 PB de volumen. Este enfoque basado en datos, combinado con sofisticados algoritmos de IA, permitió a High-Flyer identificar activos con precios incorrectos y ejecutar operaciones con mayor eficiencia y precisión.

A pesar de su éxito inicial, High-Flyer enfrentó desafíos. En 2021, la empresa se disculpó públicamente por las pérdidas sufridas debido a las fluctuaciones del mercado y las limitaciones de sus modelos de IA para cronometrar las operaciones de manera efectiva. High-Flyer atribuyó las pérdidas a que sus modelos asumieron un mayor riesgo durante la volatilidad del mercado y a la rápida expansión de sus activos, lo que llevó a estrategias comerciales similares y dificultades operativas. Esta experiencia puso de manifiesto las complejidades de navegar por los mercados financieros con IA y la necesidad de una adaptación y un refinamiento continuos de los modelos de negociación.

DeepSeek: una fuerza disruptiva en el panorama de la IA

En 2021, cuando todavía lideraba High-Flyer, Liang comenzó a adquirir miles de GPU de Nvidia, sentando las bases para su ambicioso proyecto de IA, DeepSeek . Inicialmente percibido como un proyecto paralelo o el pasatiempo de un multimillonario, DeepSeek surgió como un actor importante en el panorama de la IA, con su modelo de código abierto y precios competitivos que potencialmente desafiaban la dinámica del mercado existente.

El desarrollo de DeepSeek fue impulsado por la visión de crear un sistema de IA versátil capaz de igualar, o incluso superar, las capacidades de los modelos de OpenAI. A diferencia de las empresas tradicionales con fines de lucro, DeepSeek se centró en la investigación fundamental a largo plazo, explorando los principios básicos de la inteligencia y ampliando los límites de las capacidades de la IA.

Una de las innovaciones clave de DeepSeek fue su enfoque eficiente en recursos para el entrenamiento de modelos. El modelo se construyó con sólo 2.048 GPU Nvidia H800 a un coste de 5,6 millones de dólares, un marcado contraste con los presupuestos de miles de millones de dólares de sus competidores occidentales. Esta eficiencia se derivó de una combinación de arquitecturas de modelos innovadoras, como la arquitectura Mixture-of-Experts (MoE), que activa solo una fracción de los parámetros del modelo para cada token, y Multi-Head Latent Attention, que reduce la complejidad computacional. DeepSeek también empleó métodos de entrenamiento optimizados, incluida la aritmética de precisión mixta y técnicas para minimizar la latencia de comunicación entre GPU.

El impacto de DeepSeek en el panorama de la IA ha sido significativo. Su enfoque de código abierto, junto con sus precios competitivos, ha democratizado el acceso a modelos avanzados de IA, lo que permite a las empresas más pequeñas y a los investigadores aprovechar las capacidades de IA sin necesidad de inversiones masivas. Esto ha provocado una guerra de precios entre los principales gigantes tecnológicos chinos como ByteDance, Tencent y Baidu, obligándoles a reevaluar sus estrategias de IA y sus modelos de precios.

DeepSeek ha lanzado una serie de modelos con diferentes capacidades:

Serie de modelosCaracterísticas principalesCapacidades
Codificador de búsqueda profundaEntrenado en código y lenguaje naturalGeneración de código, finalización de código
Búsqueda profunda-V2Atención Latente (MLA) de múltiples cabezas, mezcla de expertos (MoE)Mejora de la eficiencia y el rendimiento
Búsqueda profunda-V3Equilibrio de carga sin pérdidas auxiliares, predicción de múltiples tokensRazonamiento y estabilidad mejorados
Búsqueda profunda-R1Datos de arranque en frío antes de RL, destilación a modelos más pequeñosInferencia lógica, razonamiento matemático, resolución de problemas en tiempo real

DeepSeek-R1, en particular, ha demostrado un rendimiento impresionante, superando el modelo o1 de OpenAI en puntos de referencia como el American Invitational Mathematics Examination (AIME) y MATH, según DeepSeek. Este logro destaca el potencial de DeepSeek para superar los modelos existentes e impulsar nuevos avances en las capacidades de IA.

El terremoto de DeepSeek: remodelando el mercado de valores

El lanzamiento de DeepSeek envió ondas de choque a través del mercado bursátil mundial, afectando particularmente a las acciones tecnológicas. DeepSeek desencadenó una venta masiva de 1 billón de dólares en acciones tecnológicas estadounidenses y europeas en un solo día. Esta disrupción del mercado fue impulsada por las preocupaciones sobre el potencial de DeepSeek para remodelar la dinámica competitiva de la industria de la IA y desafiar el dominio de los actores establecidos, particularmente en el mercado de semiconductores.

Impacto en los fabricantes de chips:

Los fabricantes de chips como Nvidia y Broadcom experimentaron caídas significativas en los precios de sus acciones. Las acciones de Nvidia se desplomaron más del 17%, borrando aproximadamente $ 593 mil millones en valor de mercado. Este descenso se atribuyó a las preocupaciones sobre la futura demanda de semiconductores de alta gama, ya que el modelo impulsado por la eficiencia de DeepSeek planteó dudas sobre la necesidad de una potencia informática masiva en el desarrollo de la IA.

Esta idea desafía la suposición de que los aumentos continuos de la potencia informática son esenciales para el progreso de la IA, lo que podría alterar los modelos de negocio de empresas como Nvidia que dependen de la venta de GPU de alta potencia.

Impacto en los gigantes tecnológicos:

El impacto se extendió más allá de los fabricantes de chips, y gigantes tecnológicos como Alphabet y Microsoft también experimentaron disminuciones sustanciales en su capitalización de mercado. Alphabet perdió 100.000 millones de dólares en capitalización bursátil, mientras que Microsoft perdió 7.000 millones de dólares. Estos descensos reflejan las preocupaciones de los inversores sobre el potencial de DeepSeek para perturbar el mercado de la IA y erosionar la ventaja competitiva de los actores establecidos.

Impacto en los ETFs:

La disrupción del mercado también afectó a varios ETF tecnológicos. Los ETF de una sola acción, los ETF de semiconductores y los ETF de IA experimentaron descensos significativos. Por ejemplo, el GraniteShares 2x Long SMCI Daily ETF (SMCL) se desplomó un 25,3%, el YieldMax NVDA Option Income Strategy ETF (NVDY) bajó un 16,8% y el YieldMax TSM Option Income Strategy ETF (TSMY) cayó un 13,3%. Estos descensos ilustran el amplio impacto del lanzamiento de DeepSeek en el sector tecnológico y la reevaluación de las valoraciones a la luz del cambiante panorama de la IA.

Más allá del impacto inmediato en las acciones tecnológicas, DeepSeek tiene el potencial de alterar los modelos de negocio en varios sectores al hacer que la IA sea más accesible y asequible. Esto podría conducir a una mayor competencia, innovación y una adopción más amplia de las tecnologías de IA en todas las industrias.

Además, el rápido crecimiento de DeepSeek y la disrupción del mercado han ido acompañados de desafíos. La empresa fue objeto de un ciberataque, lo que la obligó a limitar temporalmente los registros de nuevos usuarios para garantizar la continuidad del servicio. Este incidente pone de manifiesto las vulnerabilidades a las que se enfrentan incluso las empresas más innovadoras en el mundo digital interconectado.

La previsión de High-Flyer y el ascenso de DeepSeek

El enfoque inicial de High-Flyer en la IA y su adquisición estratégica de GPU Nvidia antes de las restricciones de EE. UU. demostró ser un factor crucial en el éxito de DeepSeek. La previsión de Liang en la construcción de una sólida infraestructura de IA dentro de High-Flyer proporcionó a DeepSeek los recursos y la experiencia necesarios para desarrollar sus modelos innovadores. Esta decisión estratégica permitió a DeepSeek superar las limitaciones impuestas por los controles de exportación de EE. UU. a los chips avanzados de IA, lo que demuestra la importancia de anticiparse a los desafíos futuros y asegurar los recursos críticos.

Si bien High-Flyer enfrentó reveses en sus esfuerzos de comercio cuantitativo, su inversión en investigación y desarrollo de IA finalmente dio sus frutos con la aparición de DeepSeek. La transición de la empresa de un fondo de cobertura centrado en los mercados financieros a un actor clave en el panorama de la IA demuestra su adaptabilidad y visión estratégica. Esta transición pone de manifiesto el potencial de las empresas para aprovechar su experiencia y recursos existentes para capitalizar las oportunidades emergentes en nuevos dominios tecnológicos.

La respuesta de OpenAI y el futuro de la competencia en IA

OpenAI, la empresa líder en investigación de IA, reconoció las impresionantes capacidades de DeepSeek, y el CEO Sam Altman lo calificó como “un modelo impresionante, particularmente en torno a lo que pueden ofrecer por el precio”. También declaró que era “legítimo y estimulante tener un nuevo competidor” y que OpenAI estaría “sacando algunos lanzamientos” en respuesta. Esta respuesta sugiere que el surgimiento de DeepSeek ha estimulado un sentido de competencia y un enfoque renovado en la innovación dentro de OpenAI.

Si bien reconoció la competencia, Altman siguió confiando en la capacidad de OpenAI para ofrecer modelos aún mejores, enfatizando la importancia de la investigación y el desarrollo continuos y la creencia de que “más computación es más importante ahora que nunca para tener éxito en nuestra misión”. Esto sugiere que es probable que OpenAI continúe invirtiendo en modelos de IA a gran escala e infraestructura informática avanzada para mantener su ventaja competitiva.

La aparición de DeepSeek ha intensificado la carrera global de la IA, lo que ha provocado una reevaluación de las estrategias de desarrollo tradicionales y ha fomentado un mayor enfoque en la eficiencia y la colaboración de código abierto. Es probable que la competencia entre DeepSeek y OpenAI impulse una mayor innovación y acelere el desarrollo de modelos de IA aún más potentes y accesibles. Esta competencia podría conducir a un panorama de IA más dinámico y diverso, con diferentes empresas e instituciones de investigación que persiguen diversos enfoques para el desarrollo de la IA.

Conclusión: una nueva era de innovación impulsada por la IA

El viaje de Liang Wenfeng de un comerciante cuantitativo a un innovador de IA ha alterado el mercado de valores y el panorama de la IA. El enfoque basado en la eficiencia, la filosofía de código abierto y los precios competitivos de DeepSeek han desafiado el dominio de los actores establecidos y han democratizado el acceso a las capacidades avanzadas de IA. Esto ha desencadenado una nueva era de innovación impulsada por la IA, con implicaciones para varios sectores, incluidos los financieros, la tecnología y otros.

El éxito de DeepSeek desafía la noción de que los presupuestos masivos y los vastos recursos informáticos son esenciales para desarrollar modelos de IA de vanguardia. Esto podría conducir a un cambio en el panorama de la IA, con empresas más pequeñas e instituciones de investigación desempeñando un papel más importante en el desarrollo y la innovación de la IA. La mayor accesibilidad de las herramientas de IA también podría acelerar la adopción de la IA en diversas industrias, lo que conduciría a nuevas aplicaciones y cambios transformadores en la forma en que las empresas operan y compiten.

Es probable que la dinámica competitiva entre DeepSeek y OpenAI dé forma al futuro de la IA. La respuesta de OpenAI a la aparición de DeepSeek sugiere que la compañía se está tomando en serio a la competencia y está comprometida a mantener su posición como líder en el campo de la IA. Esta competencia podría impulsar nuevos avances en las capacidades de IA, lo que llevaría al desarrollo de modelos de IA más sofisticados y versátiles.

El impacto más amplio de la aparición de DeepSeek se extiende más allá del sector tecnológico. El éxito de la empresa pone de manifiesto la creciente importancia de la IA en la economía mundial y el potencial de la IA para impulsar la innovación y el crecimiento económico. A medida que las tecnologías de IA continúen evolucionando y se vuelvan más accesibles, es probable que desempeñen un papel cada vez más importante en la configuración del futuro de diversas industrias y de la economía mundial en su conjunto.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Carrito de compra
[mwai_chatbot id="default"]
X
Scroll to Top
Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos. Contiene enlaces a sitios web de terceros con políticas de privacidad ajenas que podrás aceptar o no cuando accedas a ellos. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Más información
Privacidad