Kimi K2 pode ser um novo Deepseek?

Um novo modelo chinês, aberto e focado em 'chamadas de ferramentas' está se destacando em alguns benchmarks para IA. Será que temos um novo Deepseek em nossas mãos?

https://www.scmp.com/tech/tech-trends/article/3331971/chinas-moonshot-ai-launches-new-model-lauded-no-1-among-open-source-systems

Moonshot AI’s new model showed that “the gap between closed and open [AI models] continues to narrow”, wrote Mohammad Emad Mostaque, founder of British developer Stability AI, in a post on X.

  • Recentemente foi lançada uma nova versão do modelo Kimi K2 da empresa Moonshot AI
    • A startup possui investimentos das Alibaba e Tencent
  • Ele está dando o que falar porque em alguns testes, como por exemplo o Humanity's Last Exam, foi capaz de superar os modelos da OpenAI (ChatGPT 5)
  • É um modelo de pesos abertos, embora tenha uma licensa que é um pouco mais restritiva do a MIT. Acima de 100mi usuários ou 20mi U$ de lucro é necessário incluir o nome do modelo usado na interface
  • O modelo tem 1 trilhão de parâmetros (pesa aprox. 600gb), usa o modelo 'mixture of experts', permite a quebra de problema em etapas menores e pode encadear chamadas de ferramentas sem intervenção o que o pessoal chama de 'agentic reasoning'

Onde posso encontrar esses pesos?

https://huggingface.co/moonshotai/Kimi-K2-Thinking

https://openrouter.ai/moonshotai/kimi-k2-thinking

IA dos EUA vs IA da China

  • O Kimi k2 teria sido treinado com apenas U$ 4.6 milhões

https://www.scmp.com/opinion/china-opinion/article/3321520/how-china-seeks-distribute-ai-while-us-only-wants-dominate

Com poucos dias de diferença, as duas superpotências mundiais em inteligência artificial (IA) revelaram planos concorrentes para o futuro. Os Estados Unidos divulgaram seu abrangente Plano de Ação para IA, que prevê a desregulamentação, a expansão da indústria de semicondutores e pacotes de exportação de IA "completos" para aliados. Dias depois, a China apresentou sua proposta na Conferência Mundial de Inteligência Artificial em Xangai: um órgão global de governança de IA aberto ao Sul Global, um incentivo à colaboração em código aberto e uma crítica sutil à ideia de que a IA esteja se tornando "um jogo exclusivo" dominado por poucas nações.

Referências

Os meus testes...

Apresentação: https://www.kimi.com/share/d48uq1elv3kf5kj0odj0

Aplicação de mapa: https://www.kimi.com/share/19a6e07c-5542-8813-8000-000090bed9fb