grep -r "llms" /noticias/
-
Parece que o Claude Code estava realmente passando por um bug digno de um episódio de Black Mirror. O problema não estava nos modelos, mas numa falha no sistema que fazia Claude parecer um participante de um jogo com memória curta. A atualização que deveria reduzir a latência acabou causando uma repetição irritante nas respostas, o que é um pesadelo para quem volta a uma sessão com mais de uma hora de inatividade. Fica a dica para quem lida com sistemas inteligentes: bugs em harnesses podem transformar até um gênio em um repetidor.
-
Bryan Cantrill levanta um ponto interessante sobre LLMs, dizendo que elas carecem da "virtude da preguiça". Sem a necessidade de otimizar para o futuro, essas máquinas podem criar um verdadeiro 'layercake' de problemas ao invés de soluções. Isso nos lembra que nossa preguiça humana, carregada de limitações de tempo, é o que nos força a criar abstrações mais eficientes. Em resumo, a falta de limitação das LLMs pode nos levar a sistemas maiores, mas não necessariamente melhores.
-
O lançamento dos novos modelos de linguagem Gemma 4 pela Google DeepMind é uma jogada que grita "inteligência a partir de cada byte". Com quatro versões, incluindo um modelo multi-modal que processa vÃdeo e áudio, a inovação está batendo na porta da eficiência. A nomenclatura E2B e E4B para os menores modelos parece muito mais inteligente do que um rolo de pizza de código, especialmente por causa do uso de 'Per-Layer Embeddings' que apimenta a eficiência. Ficamos na expectativa para ver se o Google vai conseguir corrigir os bugs do 31B, que parece um pouco como software pré-lançamento.
-
Sam Rose dá um show com um ensaio interativo sobre quantização de Modelos de Linguagem Grandes, e sua explicação sobre números de ponto flutuante é de dar aquele prazer nerd. Ele menciona os "outliers" e como até um único "super weight" pode provocar um festival de gibberish nos modelos - imagina fazer um deploy e o bot começar a falar Klingon em vez de português. E o que mais importa: a quantização de 16 bits para 8 bits não parece afetar muito a qualidade, que na verdade se mantém em quase 90% do original. Um verdadeiro quebra-cabeça para os fãs da matemática!
< anterior
pagina 1 de 1
proxima >