A Geopolítica da IA 2025/02
Nesta palestra para os alunos do IFRS Canoas nós damos uma atualização sobre como anda a corrida pela IA entre EUA e China no segundo semestre de 2025.
O que é um computador?
- Eu gosto de pensar numa calculadora glorificada e muito rápida
- Por meio de inputs/outputs podemos representar/interpretar uma diversidade de problemas como números
- O que é computável? Sei lá cara, todo dia isso KKKKKKKK
O que é inteligência artifical?
-
Definir "inteligência" sempre foi algo muito difícil, então geralmente temos algumas maneiras de entender:
- Humanos são o parâmetro: Assumimos que humanos possuem inteligência e algo que exibe comportamento humano seria inteligente. Teste de Turing
- Modelo de ser racional, simbólico: Assumimos que um ser racional com um conjunto de informações terá um determinado comportamento "correto". Nesse caso um ser inteligente age de uma maneira "racional"
-
O campo da inteligência artificial começa a se desenvolver na década de 1950 e um evento pivotal é a Dartmouth Conference, onde se cunha o termo.
-
O modelo simbólico se mostrou muito promissor nos primeiros anos, mas a explosão combinatória de proposições lógicas e a necessidade de muitos dados de alta qualidade (expert data systems) e contradições e nuances nesses dados deixou o campo empacado em meados de 1980
IAs generativas
-
Durante os anos 2000 começa a se popularizar o uso das técnicas de Machine Learning para a construção de inteligência artificial. O nosso algoritmo tem um estado inicial e um estado final desejado e deve calcular esse "caminho" sem uma receita pré-estabelecida
- Deepmind, comprada pela Google começa a usar o Reinforcement Learning para jogar diversos melhor que humanos.
- Esse tipo de aprendizado geralmente é implementado com o uso de Redes Neurais
- Dados são usados para criar essas redes, porém não lógica ou simbólicamente, mas baseado na probablidade
- Um modelo baseado nesse tipo de dados e redes de conexões pode ser usado para prever o comportamente de dados inexistentes na rede
-
Em 2017 pesquisadores da Google publicam o artigo "Attention Is All You Need". Esse trabalho é crucial para a criação dos modelos GPT
-
Em 2015 a OpenAI começa como uma organização sem fins lucrativos. Seu foco principal era promover a pesquisa aberta em IA, com a ideia de compartilhar descobertas para beneficiar a humanidade.
- Porém em 2019 eles criaram uma estrutura mista de financiamento privado com "capped-profits" para atrair um mair número de investimentos
-
Em 2022 o ChatGPT é lançado e em 5 dias alcança 1 milhão de usuários e em 2 meses 100 milhões.
- Grande disponibilidade de dados. Decorrência do que Shoshana Zuboff chama de capitalismo de vigilância
- Avanços científicos e tecnológicos
- Disponibilidade de hardware (GPUs)
- Investimento de big techs e bilionários
Esse vídeo aqui tem essa história em muito mais detalhes:
No meu canal nós temos essa palestra indo para o lado mais têcnico:
IA ao estilo EUA
-
A OpenAI inaugurou essa nova era do desenvolvimento de "IA".
- Modelos generativos
- Utilizando volumes enormes de dados
- Cada vez mais hardware para processamento de treinamento e inferência.
- Foco em modelos privados para vantagem competitiva
- Pesquisas "abertas" porém liberadas com atraso
- Investimento de dinheiro massivo e propriedade privada
-
Existe essa visão que as tecnologias de IA são uma poderíssima ferramenta para o desenvolvimento tecnológico (parece com como a criptografia já foi vista) e a sua exportação é perigosa
-
Então no governo Trump 1, Biden e Trump 2 baseado numa tendência de embargos dos EUA à China (Huwaei, DJI, Dahua, TikTok, veículos elétricos) também se formou o Framework for Artificial Intelligence Diffusion
- Restrição de exportação de chips com uma quantidade de compute acima de um limiar
-
A ideia era que o hardware acessível aos EUA e seus aliados estaria sempre 2 anos à frente dos seus competidores
Mas isso não impediu o Deepseek...
- Um LLM, baseado em mixture of experts e com hablidade de 'raciocínio' e performance similar ou as vezes superior que os modelos Chat GPT o1 e Gemini
- Isso tudo ao mesmo tempo que é um modelo de código aberto. Isso quer dizer, os pesos resultado do treinamento. Porém também foi lançado um artigo explicando como ele funciona e foi treinado
- Disponível portanto para ser analisada, estudada e adaptada por outras empresas e entusiastas da área. Além de ser rodada localmente (como os modelos LLama e Mistral por exemplo)
- Criado por uma startup financeira chinesa que tinha diversas GPUs sobrando e queria achar um uso para elas
Tá custando quanto?
-
O custo de processamento do modelo da Deepseek é muito menor. Mais rápido com o mesmo equipamento OU menos equipamento para a mesma performance
-
Custo das chamadas de API para o serviço da Deepseek é 96% mais barato que os competidores, como por exemplo a OpenAI.
-
O custo de treinamento teria sido de apenas 6 milhões de dólares. Para comparação o ChatGPT 4 é estimado custar entre 41 a 78 milhões, embora o Sam Altman tenha dito, mais de 100 milhões.
-
GPT-5 provavelmente custou muito mais, porém eu só encontrei dados sem fonte (de U$500mi a U$2bi então não dá pra levar muito a sério)
-
Elon Musk anunciou um data center para treinamento do Grok na faixa de 4bi e com o Stargate anunciado a alguns dias pelo governo dos EUA prometeu 500bi para o setor de IA.
- Muito se falou que esse custo de treinamento deveria estar sendo subsidiado ou que a China tem 'GPUs secretas', mas os modelos e a pesquisa estão aí para serem validados.
-
Uma parte importantíssima do white paper do Deepseek é a explicação do treinamento de racicínio
- Uso de dados sintéticos: outros modelos são apresentados com perguntas e soluções e constroem raciocínios para resolvê-los
-
É explicado o método do destilamento de modelos. Um modelo 'professor' faz o fine tuning de um modelo 'aluno' apenas com dados de alta qualiade
-
Lançaram algumas destilações do deepseek r1 em modelos da qwen
É um método que está sendo muito adotado agora e abre caminho para o 'destilar e amplificar'
-
Os EUA contra ataca
-
Como todo mundo já deve ter ouvido falar, rolou aquela coisa do tarifaço do Trump
-
O maior alvo das tarifas era a China e o plano era que rolassem tarifas recíprocas mesmo. A ideia era isolar a China dos seus parceiros comerciais
-
A China trucou e aos poucos o Trump foi voltando atrás de cada uma das tarifas até o que temos agora
-
Veio à baila o papo de terras raras, necessárias para a produção de componentes eletrônicos, os quais a China tem quase um monopólio do refinamento
A diretiva para desenvolvimento da IA dos EUA
- Regulamentação de IA (ou NÃO regulamentação de IA). Nada de IAs 'woke' (leia-se 'não alinhada com os valores morais conservadores') e pressionar estados e países que tentarem regulamentar IA
- Expeditar a legislação ambiental pra construção de mais data centers. Garantir mais recursos naturais e energéticos para big techs
- Mais restrições contra a China e aceleração do ritmo do desenvolvimento. Corrida pela IA
- Contratos milionários para as big techs dos EUA
- Lá no finalzinho do documento: segurança dos modelos de IA, fomentar pesquisa e modelos abertos
ChatGPT-5 e gpt-oss
https://openai.com/index/introducing-gpt-oss/
-
O ChatGPT-5 foi decepcionante? Depende do que estamos prestando atenção.
- Modos diferentes de racicínio (nenhum, médio, alto)
- Supostamente mais segurança e respostas "seguras" para prompts perigosos
- Melhor integração com o uso de ferramentas
- Muito marketing, apresentação tipo Apple
-
Junto com ele temos o primeiro modelo aberto desde 2019 (gpt-2) o gpt-oss
- Pesos abertos e não software aberto. Não sabemos direito COMO ele foi feito, mas temos os pesos
-
Este modelo é muito pequeno e eficiente e foi muito bem em todos os testes mais comuns. Porém ele parece ter muito menos 'conhecimento geral' do que outros modelos.
-
Pesquisadores estão se perguntando se seria o gpt-oss um modelo estilo dos Phi-N da Microsoft?
- Dados sintéticos e de alguns domínios específicos STEM. Permite ele ir bem nos testes, mas não entrega o ouro da OpenAI
- Provavelmente não será útil para fine tuning e não terá problemas com direitos autorais
-
Mas o Deepseek não parece estar parado. Desde a primeira vez que eu fiz essa palestra o Deepseek R1 teve 1 atualização que melhorou um pouco o modelo, mas não fez um grande estardalhaço
-
Todo mundo está esperando a versão R2, mas ela foi atrasada:
https://deep-seek.chat/news/deepseek-r2-roadmap/
- Boatos de que ela foi atrasada para causar um maior impacto. Também se fala que pode ser mais barata para rodar e será baseada nas arquiteturas de GPU da Huawei. HUGE IF TRUE
- Não esquecer dos modelos qwen da Alibaba que tem performado muito bem e vem comendo pelas beiradas
Os benchmarks estão assim hoje (não levem tão a sério)
Vulnerabilidade da China na corrida
- A China está supostamente alguns meses ou anos atrás em desenvolvimento tecnológico do que os EUA
- Muito difícil de acompanhar o que se passa (mistura de barreira da língua com tendenciosidade da nossa mídia)
- A China depende ainda das cadeias produtivas de chips controladas pelos EUA e aliados: TSMC (Taiwan), Coréia do Sul, Japão e Holanda
- Mesmo para os Huawei Ascend 910C que usa chips da TSMC
- Existem projetos voltados à diminuição dessa dependência
- Ascend 910C: Aceleradores de IA próprias (para substituir a dependência nos chips mais antigos da NVIDIA que eles tem acesso)
- Projetos de rack compartilhado como Huawei CloudMatrix 384
Como juntar bilionários, big tech e "populismo"? R: China
-
Os EUA tem um problema hoje e ele se chama neoliberalismo
-
Desde a desregulamentação da economia e o desmonte das suas manufaturas o que se viu foi um fluxo de suas indústrias para além mar: China, Vietnã, Camboja, Singapura...
-
Isso foi ruim para os Estado Unidos? Não e quem nos explica é a teoria marxista da dependência
- Nós vendemos café in natura e compramos iPhone
- Eles vendem iPhones e tomam o melhor café do mundo
-
Só que eles podem até vender o iPhone, mas quem fabrica o iPhone é o Chinês que recebe numa moeda desvalorizada em relação ao dólar
- A criação do "Designed in California / Made in China"
-
Acontece que a China soube aproveitar essa situação a seu favor e fez uma transferência tecnológica "na marra" e agora o produto Chinês não é mais sinônimo de "cópia de baixa qualidade"
-
Então a desindustrialização dos EUA é culpa de quem? Dos industriais que lucraram com a destruição da classe média estadunidense? Não, é convenientemente da China e dos imigrantes!
-
Obviamente racismo, xenofobia, orientalismo são o temperinho que finaliza o sabor desse caldo
-
Ao mesmo tempo que isso as big techs se acomodam ao lado do Trump em busca de vantagens e subsídios para seus produtos, se posicionando como 'as jóias da coroa' tecnológica dos EUA
-
Isso se expressa no último vexame que foram as tarifas do Trump contra o Brasil. Eles falaram do Bolsonaro, mas grande parte dos relatórios que foram usados falavam do PIX, LGPD e regulamentação das redes sociais.
-
A moralização da política e a guerra cultural servem para avançar as pautas da extrema direita.
- Pela liberdade de expressão. Contra IA 'woke', pautas de gênero, teoria crítica racial e toda essa baboseira. Serve para impedir a regulamentação
- O ambientalismo é colocado como 'contra o progresso' e atrasando os EUA que precisam desenvolver a sua indústria tecnológica: "build baby build"
- "EUA primeiro" justifica o domínio deles sobre outros países (como nós da América Latina) e a exploração de nossos recursos naturais (e nossos DADOS)
-
Essa é a fina corda bamba que equilibra uma coalisão de bilionários, big techs e trabalhadores na chapa de Trump e JD Vance
Como os EUA usam a China de bode expiatório pra todos seus problemas:
Coisas para a gente discutir
- Qual o papel do Brasil nessa disputa?
- Meio ambiente e datacenters no sul global (Eldorado do Sul)
- Relatório IA 2027