#generative-ai - RetroNews

Simon Willison 25/04/2026 16:44

A combinação de 'cavalo, astronauta, pelicano e bicicleta' é a prova perfeita de que a criatividade da IA pode ir muito além do esperado, e, honestamente, isso é um pouco como programas mal feitos: caóticos, mas você se pergunta como tudo ainda está funcionando. A frase de Scott sobre precisar 'empilhar esses testes' ressoa bem, já que todos nós sabemos que em tecnologia, a única constante é a necessidade de mais benchmarking. Quem diria que uma imagem poderia gerar tanta conversa sobre testes de performance?

#ia #generative-ai #text-to-image

https://simonwillison.net/2026/Apr/25/why-are-you-like-th...

Guia de prompts para o GPT-5.5

Simon Willison 25/04/2026 04:13

Com a chegada do GPT-5.5 na API, a OpenAI está nos dando dicas valiosas para levar nossos prompts ao próximo nível. Uma recomendação interessante é enviar um rápido update para o usuário antes de tarefas longas, para evitar aquela sensação de que o modelo caiu em um loop eterno como um bug no Matrix. Além disso, a OpenAI enfatiza que a transição para o GPT-5.5 deve ser feita com calma, como se estivéssemos reiniciando o computador, e não apenas trocando a bateria da mesma ferramenta. Então, pé no freio e comece do zero, porque nem todo código legado é ouro.

#generative-ai #ai #prompt-engineering #openai #gpt

https://simonwillison.net/2026/Apr/25/gpt-5-5-prompting-g...

Uma atualização sobre os recentes relatórios de qualidade do Claude Code

Simon Willison 24/04/2026 01:31

Parece que o Claude Code estava realmente passando por um bug digno de um episódio de Black Mirror. O problema não estava nos modelos, mas numa falha no sistema que fazia Claude parecer um participante de um jogo com memória curta. A atualização que deveria reduzir a latência acabou causando uma repetição irritante nas respostas, o que é um pesadelo para quem volta a uma sessão com mais de uma hora de inatividade. Fica a dica para quem lida com sistemas inteligentes: bugs em harnesses podem transformar até um gênio em um repetidor.

#generative-ai #ai #coding-agents #llms

https://simonwillison.net/2026/Apr/24/recent-claude-code-...

Qwen3.6-27B: Performance de Codificação de Nível Flagship em um Modelo Denso de 27B

Simon Willison 22/04/2026 16:45

A nova promessa da Qwen parece bem interessante: "Qwen3.6-27B entrega performance de codificação de nível flagship". Um modelo que pesa menos de 56GB, mas promete mais do que seu irmão mais velho de 397GB – é quase como o nerd que troca os livros pesados por e-books e ainda se torna o melhor da classe. Os números, como os 25.57 tokens/s durante a geração, fazem a gente pensar que a eficiência é o novo hype, mas lembrando sempre: não existe almoço grátis no mundo do desenvolvimento. Será que a comunidade vai abraçar esse "novo garoto" na festa dos LLMs?

#ia #generative-ai #cloud #local-llms #llm-release

https://simonwillison.net/2026/Apr/22/qwen36-27b/#atom-everything

Mudanças nos planos individuais do GitHub Copilot

Simon Willison 22/04/2026 03:30

As mudanças no GitHub Copilot estão fazendo a gente repensar a própria essência do projeto. "Agentes estão fazendo mais trabalho, e mais clientes estão atingindo limites de uso" – isso mostra como a demanda está crescendo e que a forma como cobravam anteriormente precisa de um ajuste fino. A questão dos limites de uso por sessão e semanal é uma tentativa de lidar com o aumento crescente no consumo de recursos. Mas observa-se que a nomenclatura não ajuda; com tantos produtos chamando-se 'Copilot', é uma verdadeira roleta russa de funcionalidades.

#ia #generative-ai #github #llm-pricing #github-copilot

https://simonwillison.net/2026/Apr/22/changes-to-github-c...

scosman/pelicans_riding_bicycles

Simon Willison 21/04/2026 15:54

Parece que Steve Cosman resolveu dar uma pedalada na imaginação coletiva ao "poluir" conjuntos de treinamento com pelicanos em bicicletas. Uma abordagem curiosa, para dizer o mínimo; quem diria que as aves poderiam ter hobbies tão excêntricos? O fato de ele admitir que seus próprios exemplos também contam como contaminação só adiciona um toque de sinceridade no jogo de criação de IA. No fim, quem não gostaria de ajudar uma IA a sonhar com aves sobre duas rodas?

#ia #generative-ai #training-data

https://simonwillison.net/2026/Apr/21/scosman/#atom-everything

llm-openrouter 0.6

Simon Willison 20/04/2026 18:00

A nova atualização do llm-openrouter 0.6 traz um comando para atualizar a lista de modelos disponíveis sem esperar o cache expirar. Isso é tipo um CTRL+R para os desenvolvedores que não têm tempo a perder tentando esperar os dados entrarem num estado aceitável. Agora, podemos brincar com o Kimi 2.6 assim que ele chega. Viver no limite da tecnologia é quase como pilotar uma pelican numa bicicleta – divertido e meio questionável.

#ia #backend #open-source #generative-ai

https://simonwillison.net/2026/Apr/20/llm-openrouter/#ato...

Contador de Tokens Claude, agora com comparações de modelos

Simon Willison 20/04/2026 00:50

A atualização do Contador de Tokens Claude é uma boa pedida para quem quer comparar caixas-preta da AI. Com a diferença de tokenizer entre os modelos, especialmente entre o Opus 4.7 e o 4.6, vai ser interessante observar como isso afeta o custo: "o mesmo input pode mapear para mais tokens—aproximadamente 1.0–1.35× dependendo do tipo de conteúdo". Além disso, a melhoria na aceitação de imagens também é notável, principalmente para quem trabalha com visuais mais pesados, quase dá para sentir o peso das imagens na conta, não é mesmo? No final das contas, é uma ótima ferramenta para quem não gosta de surpresas na fatura do final do mês.

#ia #generative-ai #tokenization

https://simonwillison.net/2026/Apr/20/claude-token-counts...

Qwen3.6-35B-A3B no meu laptop desenhou um pelicano melhor que Claude Opus 4.7

Simon Willison 16/04/2026 17:16

Parece que a batalha dos modelos de IA está tão acirrada que até o benchmark do pelicano de bicicleta se tornou relevante. O autor deu a vitória para o Qwen 3.6, destacando que "Opus conseguiu bagunçar o quadro da bicicleta!". Quem diria que o Qwen 3.6, rodando em um MacBook Pro, superaria a versão mais recente da Anthropic? Claro, o benchmark é uma piada, mas isso só reforça como a qualidade das saídas pode refletir a utilidade geral dos modelos. No fim das contas, se você precisa de um SVG de um pelicano em cima de uma bicicleta, Qwen parece ser a escolha certa no momento.

#ia #generative-ai #local-llms #llm-release

https://simonwillison.net/2026/Apr/16/qwen-beats-opus/#at...

Gemini 3.1 Flash TTS

Simon Willison 15/04/2026 17:13

O Google lançou hoje o Gemini 3.1 Flash TTS, um modelo de texto-para-fala que promete transformar prompts em áudio de forma bem interessante. Com um guia de prompts “surpreendente”, eles capturaram a essência de uma gravação de rádio, como o exemplo com o personagem Jaz, que parece ter saído diretamente de um episódio de Black Mirror. Agora, se você quer que sua máquina fale como um DJ animado de Londres, suas preces foram atendidas. Resta saber se isso vai ajudar em nossas reuniões virtuais ou apenas nos deixar com vontade de dançar no escritório.

#ia #generative-ai #ai #tools #prompt-engineering

https://simonwillison.net/2026/Apr/15/gemini-31-flash-tts...

Citando Bryan Cantrill

Simon Willison 13/04/2026 02:44

Bryan Cantrill levanta um ponto interessante sobre LLMs, dizendo que elas carecem da "virtude da preguiça". Sem a necessidade de otimizar para o futuro, essas máquinas podem criar um verdadeiro 'layercake' de problemas ao invés de soluções. Isso nos lembra que nossa preguiça humana, carregada de limitações de tempo, é o que nos força a criar abstrações mais eficientes. Em resumo, a falta de limitação das LLMs pode nos levar a sistemas maiores, mas não necessariamente melhores.

#generative-ai #ai #llms

https://simonwillison.net/2026/Apr/13/bryan-cantrill/#ato...

Gemma 4: Byte por byte, os modelos abertos mais capazes

Simon Willison 02/04/2026 18:28

O lançamento dos novos modelos de linguagem Gemma 4 pela Google DeepMind é uma jogada que grita "inteligência a partir de cada byte". Com quatro versões, incluindo um modelo multi-modal que processa vídeo e áudio, a inovação está batendo na porta da eficiência. A nomenclatura E2B e E4B para os menores modelos parece muito mais inteligente do que um rolo de pizza de código, especialmente por causa do uso de 'Per-Layer Embeddings' que apimenta a eficiência. Ficamos na expectativa para ver se o Google vai conseguir corrigir os bugs do 31B, que parece um pouco como software pré-lançamento.

#generative-ai #local-llms #ai #llms #gemma

https://simonwillison.net/2026/Apr/2/gemma-4/#atom-everything

Quantização do zero

Simon Willison 26/03/2026 16:21

Sam Rose dá um show com um ensaio interativo sobre quantização de Modelos de Linguagem Grandes, e sua explicação sobre números de ponto flutuante é de dar aquele prazer nerd. Ele menciona os "outliers" e como até um único "super weight" pode provocar um festival de gibberish nos modelos - imagina fazer um deploy e o bot começar a falar Klingon em vez de português. E o que mais importa: a quantização de 16 bits para 8 bits não parece afetar muito a qualidade, que na verdade se mantém em quase 90% do original. Um verdadeiro quebra-cabeça para os fãs da matemática!

#desenvolvimento #ia #generative-ai #llms #sam-rose

https://simonwillison.net/2026/Mar/26/quantization-from-t...

Citando Kimi.ai @Kimi_Moonshot

Simon Willison 20/03/2026 17:29

Kimi.ai parabeniza a equipe do Cursor pelo lançamento do Composer 2, destacando que o Kimi-k2.5 é a base dessa nova ferramenta. A integração do modelo via plataforma de RL da FireworksAI é um exemplo interessante de como a colaboração pode acelerar inovações no ecossistema de IA. É sempre bom ver como essas parcerias trazem resultados práticos e não apenas promessas no hype das LLMs.

#ia #open-source #generative-ai

https://simonwillison.net/2026/Mar/20/cursor-on-kimi/#ato...

Autoresearching Apple's "LLM in a Flash" para rodar Qwen 397B localmente

Simon Willison 18/03/2026 20:56

Dan Woods conseguiu o que muitos achavam impossível: rodar o Qwen3.5-397B-A17B em um MacBook Pro M3 Max com 48GB, mesmo sendo um modelo que ocupa 209GB em disco. Ele usou técnicas do paper da Apple, "LLM in a flash", que desafia a lógica ao trabalhar com LLMs que ultrapassam a capacidade de DRAM. É um ótimo exemplo de como a engenharia precisa contornar limitações reais, tipo quando você tenta instalar um jogo AAA em um HD cheio. A questão do impacto na qualidade, em especial com a quantização, é algo para ficar de olho, já que o que importa é a entrega final, não basta rodar um modelo se ele não responde bem. E você, já fez suas próprias experiências com quantização?

#ia #generative-ai #local-llms

https://simonwillison.net/2026/Mar/18/llm-in-a-flash/#ato...

Apresentando o Mistral Small 4

Simon Willison 16/03/2026 20:41

O Mistral Small 4 chegou com a proposta de juntar o melhor dos modelos da Mistral, e a intenção é boa. Agora você pode escolher entre raciocínio leve ou pesado, mas deixaram a desejar ao não incluir claramente as opções na documentação da API. Como qualquer ferramenta nova, vai precisar de um pouco de polimento. E enquanto isso, o Leanstral promete ser o herói dos desenvolvedores da linguagem Lean 4, mas ainda estou na dúvida se isso vai ser uma revolução ou só mais um 'Hello World'.

#ia #generative-ai #llm

https://simonwillison.net/2026/Mar/16/mistral-small-4/#at...

Agentes de codificação para análise de dados

Simon Willison 16/03/2026 17:12

A ideia de usar agentes de codificação como Claude Code e OpenAI Codex para ajudar jornalistas de dados é interessante. Durante o workshop de três horas, os participantes aprenderam a explorar, analisar e limpar dados usando Python e SQLite, uma combinação que já é quase um clássico na rotina de qualquer dev. O que realmente chamou atenção foi a parte em que Claude Code gerou visualizações interativas em tempo real. Sem dúvida, uma maneira moderna de engajar com análise de dados, e o melhor, acessível através de uma API bem friendly. Agora, espero que não tenham cometido nenhum 'merge conflict' na hora de apresentar os resultados.

#generative-ai #ai #python #data-journalism #github-codespaces

https://simonwillison.net/2026/Mar/16/coding-agents-for-d...

Contexto de 1M agora disponível para Opus 4.6 e Sonnet 4.6

Simon Willison 13/03/2026 15:29

Parece que a OpenAI e a Gemini finalmente decidiram que cobrar mais por long context é muito 2003. Agora, a "precificação padrão" se aplica a toda a janela de 1M, sem taxas adicionais. Isso é um sinal de que os modelos estão ficando mais acessíveis, mas ainda assim, é bom lembrar que a eficiência e o custo ainda são temas delicados no mundo da IA. Um passo para democratizar o acesso, mas ainda precisamos ficar espertos com as nuances de cada ferramenta.

#ia #generative-ai #llm-pricing

https://simonwillison.net/2026/Mar/13/1m-context/#atom-everything

grep -r "generative-ai" /noticias/