#llms - RetroNews

Uma atualização sobre os recentes relatórios de qualidade do Claude Code

Simon Willison 24/04/2026 01:31

Parece que o Claude Code estava realmente passando por um bug digno de um episódio de Black Mirror. O problema não estava nos modelos, mas numa falha no sistema que fazia Claude parecer um participante de um jogo com memória curta. A atualização que deveria reduzir a latência acabou causando uma repetição irritante nas respostas, o que é um pesadelo para quem volta a uma sessão com mais de uma hora de inatividade. Fica a dica para quem lida com sistemas inteligentes: bugs em harnesses podem transformar até um gênio em um repetidor.

#generative-ai #ai #coding-agents #llms

https://simonwillison.net/2026/Apr/24/recent-claude-code-...

Citando Bryan Cantrill

Simon Willison 13/04/2026 02:44

Bryan Cantrill levanta um ponto interessante sobre LLMs, dizendo que elas carecem da "virtude da preguiça". Sem a necessidade de otimizar para o futuro, essas máquinas podem criar um verdadeiro 'layercake' de problemas ao invés de soluções. Isso nos lembra que nossa preguiça humana, carregada de limitações de tempo, é o que nos força a criar abstrações mais eficientes. Em resumo, a falta de limitação das LLMs pode nos levar a sistemas maiores, mas não necessariamente melhores.

#generative-ai #ai #llms

https://simonwillison.net/2026/Apr/13/bryan-cantrill/#ato...

Gemma 4: Byte por byte, os modelos abertos mais capazes

Simon Willison 02/04/2026 18:28

O lançamento dos novos modelos de linguagem Gemma 4 pela Google DeepMind é uma jogada que grita "inteligência a partir de cada byte". Com quatro versões, incluindo um modelo multi-modal que processa vídeo e áudio, a inovação está batendo na porta da eficiência. A nomenclatura E2B e E4B para os menores modelos parece muito mais inteligente do que um rolo de pizza de código, especialmente por causa do uso de 'Per-Layer Embeddings' que apimenta a eficiência. Ficamos na expectativa para ver se o Google vai conseguir corrigir os bugs do 31B, que parece um pouco como software pré-lançamento.

#generative-ai #local-llms #ai #llms #gemma

https://simonwillison.net/2026/Apr/2/gemma-4/#atom-everything

Quantização do zero

Simon Willison 26/03/2026 16:21

Sam Rose dá um show com um ensaio interativo sobre quantização de Modelos de Linguagem Grandes, e sua explicação sobre números de ponto flutuante é de dar aquele prazer nerd. Ele menciona os "outliers" e como até um único "super weight" pode provocar um festival de gibberish nos modelos - imagina fazer um deploy e o bot começar a falar Klingon em vez de português. E o que mais importa: a quantização de 16 bits para 8 bits não parece afetar muito a qualidade, que na verdade se mantém em quase 90% do original. Um verdadeiro quebra-cabeça para os fãs da matemática!

#desenvolvimento #ia #generative-ai #llms #sam-rose

https://simonwillison.net/2026/Mar/26/quantization-from-t...

grep -r "llms" /noticias/