Blogs

DeepSeek Se Vuelve Viral: ¿Podrá La Ola De AI Alcanzar Nuevas Alturas?

Hora de actualización: feb. 10, 2025    Lectores: 72

DeepSeek Se Vuelve Viral: ¿Podrá La Ola De AI  Alcanzar Nuevas Alturas?

En los últimos tiempos, DeepSeek ha sido sin duda el centro de atención de la escena tecnológica. Lanzado por deepin, una startup de inteligencia artificial de phantom square, el gran modelo de ia encabezó la lista de descargas mundiales en varias tiendas de aplicaciones. DeepSeek está en auge y también ha encendido el entusiasmo del mercado de capitales. Desde la apertura del mercado después del festival de primavera, el concepto DeepSeek y los índices de computación en la nube han progresado con más del 10%. El sector de las computadoras y los medios de comunicación también está en la parte superior de la industria de primer nivel de citic.
Los avances de DeepSeek fueron principalmente de bajo costo y capacidad de razonamiento. Mientras que el modelo V3 ha logrado avances significativos en costos de entrenamiento y eficiencia computacional, el modelo R1 ha sido innovador en nuevos enfoques para modelos de inferencia de entrenamiento. A través de la optimización de ingeniería como FP8, MoE, MLA y PTX, no solo maximice la utilización de recursos de fuerza computacional y reduzca significativamente los costos (por ejemplo, su costo de entrenamiento es solo 1/30 de su equivalente en OpenAI), Y sobresalió en matemáticas, código y razonamiento en lenguaje natural, superando a OpenAI o1 en rendimiento.
Antes del modelo deepseek-r1, los grandes modelos de la industria utilizaban el RLHF (Reinforcement Learning from HumanFeedback, aprendizaje por refuerzo basado en la retroalimentación humana), un modelo que utilizaba un gran número de preguntas y respuestas de alta calidad escritas por humanos para entender "qué es una buena respuesta". Es como tener un profesor que está siempre al lado para guiar la resolución del problema. Este método, aunque eficaz, presenta cuellos de botella. El modelo R1, que ha abandonado la parte HF (retroalimentación humana) del RLHF para dejar solo la pura RL (aprendizaje por refuerzo), equivale a dejar de depender de la instrucción del profesor y en lugar de hacerlo usted mismo, aprender a través de intentos y errores constantes.
En concreto, el modelo de aprendizaje por refuerzo del modelo R1 se fija dos "funciones de recompensa" :
Función resultado correcto: se da una recompensa cada vez que se encuentra una respuesta correcta. Esta respuesta se valida a través de una herramienta externa, asegurándose de que es realmente correcta.
Función del proceso de pensamiento: incluso si la respuesta no es necesariamente del todo correcta, siempre y cuando el proceso de razonamiento es lógico y claro y los pasos son razonables, se da una recompensa. Es como resolver un problema, aunque la respuesta final no sea correcta, pero la idea es excelente y merece ser alentada.
De esta manera, el modelo R1 continúa probando diferentes métodos de resolución de problemas y luego evalúa su propio rendimiento de acuerdo con estas dos reglas de recompensa, finalmente aprende qué métodos son más eficaces y qué pasos de razonamiento son más razonables, y finalmente se vuelve cada vez más inteligente y mejora su capacidad de razonamiento. Lo más importante es que el modelo R1 no requiere una gran cantidad de datos en el proceso, sino que aumenta la capacidad a través del autoaprendizaje y la optimización. Al mismo tiempo, la implementación de código abierto de la afirmación del modelo acorta la brecha tecnológica entre el modelo de código abierto y el modelo de código cerrado, y también acorta la brecha tecnológica entre la inteligencia artificial de China y los Estados Unidos.
Con respecto a esta ronda de ofertas de ia y oportunidades futuras potenciales, el auge de DeepSeek significa que el desarrollo futuro de la ia en todo el mundo puede ser más plural, mientras que se espera que la gran reducción del modelo acelere la formación de un ciclo cerrado de comercialización de aplicaciones de ia. DeepSeek espera acelerar el aterrizaje de aplicaciones de inteligencia artificial, impulsando un crecimiento explosivo de la demanda de postentrenamiento y computación inferencial. Se espera que la proporción de la demanda final de inferencia en la estructura posterior de la placa de fuerza computacional aumente aún más, para el chip de fuerza computacional de inferencia, la formación de la fuerza de cálculo final es favorable.
Por otro lado, los modelos operativos de las startups de ia experimentarán un cambio: las empresas de ia que dependen de costosos clusters de GPU pueden estar en riesgo de bancarrota debido a una desventaja de costos. Esto resultará en un gran aumento en la oferta de gpus en el mercado de segunda mano, mientras que las empresas de ia pequeñas y medianas tienden a comprar gpus de gama baja, que son más baratos. Los requisitos de hardware también experimentarán una transformación estructural: desde el año pasado, los requisitos de fuerza computacional dirigidos por la formación han comenzado a desplazarse hacia el lado del razonamiento. Se espera que esta tendencia continúe en el futuro, ya que muchas pequeñas y medianas empresas de ia dejarán de entrenar en modelos básicos y adoptarán modelos de código abierto como DeepSeek. Además, es probable que la posición dominante de nvidia en el mercado de la formación se reevalúe.

Palabras clave: DeepSeek AI caliente