- Mu é o novo modelo de linguagem pequena da Microsoft, otimizado para ser executado localmente em dispositivos Windows 11 com NPUs.
- Sua integração inicial é feita no agente de configuração do Windows 11, permitindo ajustes usando linguagem natural.
- Mu se destaca por sua eficiência e velocidade, alcançando mais de 100 tokens por segundo graças aos seus 330 milhões de parâmetros.
- Inclui inovações como Dual LayerNorm, RoPE e GQA, e foi treinado usando processos avançados e dados educacionais de alta qualidade.

A chegada de Mu, o mais recente modelo de linguagem pequena apresentado por Microsoft, marca um passo significativo na tendência atual de colocar a inteligência artificial diretamente nos dispositivos dos usuários. Com a intenção de reduzir a dependência da nuvem e aproveitar o potencial de Unidades de Processamento Neural (NPU), Mu está integrado no Copiloto+ PCs corrida Windows 11, inicialmente com foco no Aplicativo de configurações para facilitar o acesso e a modificação dos parâmetros do sistema usando apenas linguagem natural.
Este avanço significa que, em vez de enviar consultas para servidores externos, o processamento e as respostas são gerados no próprio dispositivo, garantindo maior privacidade, agilidade e eficiência. Por enquanto, o O lançamento é direcionado aos participantes do Programa Windows Insider com computadores Copilot+., embora a expectativa seja que essa tecnologia seja estendida a mais usuários e funções em futuras atualizações.
O que é Mu realmente e o que o faz se destacar?

Mu é um pequeno modelo de linguagem (SLM, por suas siglas em inglês), treinado com 330 milhões de parâmetrosSeu tamanho compacto não significa sacrifício no desempenho, pois segundo a Microsoft ele alcança números muito próximos de modelos bem maiores como Phip-3.5-miniEste equilíbrio foi alcançado graças a um rigoroso processo de treinamento que incluiu técnicas como Norma de Camada Dupla, Embeddings posicionais rotativos (RoPE) y Atenção de consulta agrupada (GQA) que proporcionam eficiência e precisão, especialmente em dispositivos com recursos limitados.
O modelo aproveita uma arquitetura codificador-decodificador do tipo transformador, capaz de processar a entrada do usuário e transformá-la em ações dentro do sistema. Graças a essa estrutura, Mu separa o processamento de entrada e saída, Que reduz a latência e o consumo de memória, pontos-chave para garantir uma experiência do usuário tranquila e sem espera.
Em testes e dados oficiais, Mu provou ser capaz de responder a mais de 100 tokens por segundo e fornecer respostas em menos de 500 milissegundosEsses números permitem interações praticamente instantâneas, mesmo quando se trata de modificar configurações ou interpretar consultas longas e variadas em linguagem cotidiana. Se você quiser se aprofundar em como esses modelos funcionam, pode conferir Comparações entre modelos de linguagem no PC.
Integração no Agente de Configuração e funções práticas
O pouso inicial de Mu é centrado no Agente de configuração do Windows 11, um recurso que permite aos usuários ajuste os parâmetros do sistema simplesmente digitando ou dizendo o que eles precisam. Por exemplo, basta perguntar "Como ativo o modo escuro?" o "Quero aumentar o brilho" para que Mu possa traduzir essa instrução na ação técnica correspondente dentro do sistema.
A Microsoft enfatizou que a IA se adapta a dezenas de milhares de contextos e consultas diferentesDe fato, mais de 100.000 foram usados. 3,6 milhões de amostras de treinamento para abranger desde as solicitações mais comuns – como alterar o idioma ou gerenciar redes Wi-Fi – até tarefas mais complexas. Para perguntas muito curtas ou ambíguas, o sistema usa o funções de pesquisa tradicionais, mas quando a instrução é clara e detalhada, o Mu age automaticamente ou guia o usuário passo a passo.
Tecnologia e otimização adaptadas às novas gerações de hardware

La Otimização Mu foi um dos pontos mais cuidadosamente considerados durante seu desenvolvimento. A Microsoft trabalhou em colaboração com parceiros de silício, como AMD, Intel e Qualcomm para adaptá-lo às especificidades das novas NPUs presentes nos PCs Copilot+Este trabalho conjunto permitiu introduzir técnicas de quantificação pós-treinamento, que convertem os pesos e ativações do modelo em inteiros de 8 e 16 bits, reduzindo assim o consumo de memória e evitando a necessidade de retreinar todo o modelo.
O processo de treinamento de Mu foi realizado em ambientes de alto desempenho, utilizando GPUs NVIDIA A100 Dentro de Aprendizado de Máquina do AzureO conjunto de dados incluiu centenas de bilhões de tokens educacionais e técnicas como destilação de modelos Phi e Adaptação de Baixo Alcance (LoRA) para transferir conhecimento e ajustar o modelo para tarefas específicas. O resultado final é um modelo pequeno e ágil, especialmente adequado aos recursos e limitações do hardware vestível moderno. Você também pode explorar como transforme seu PC em um hub de IA local para expandir as capacidades do seu sistema.
Desafios atuais, disponibilidade e perspectivas futuras
Um dos maiores desafios que Mu enfrenta é o interpretação de consultas ambíguas ou muito breves, um problema comum em sistemas baseados em linguagem natural. Para fazer isso, A Microsoft implementou uma lógica híbridaEnquanto consultas curtas acionam resultados de pesquisa tradicionais, instruções mais detalhadas acionam a intervenção da IA, seja para orientar o usuário ou executar ações automatizadas.
Por agora, O Mu está disponível apenas em inglês e em dispositivos Copilot+ por meio do canal Insider., embora se espere que seja expandido para mais idiomas e outros dispositivos nos próximos meses, incluindo aqueles com processadores AMD e Intel. privacidade e segurança Eles também desempenham um papel fundamental, dada a natureza local do processamento.
A implantação do Mu é apenas o começo de uma estratégia mais ampla da Microsoft para incorporar IA local e modelos de linguagem eficientes em ainda mais aplicativos e aspectos do sistema operacional, melhorando a experiência e a acessibilidade sem sacrificar o desempenho ou a privacidade.
Sou um entusiasta da tecnologia que transformou seus interesses “geek” em profissão. Passei mais de 10 anos da minha vida usando tecnologia de ponta e mexendo em todos os tipos de programas por pura curiosidade. Agora me especializei em informática e videogames. Isto porque há mais de 5 anos escrevo para diversos sites sobre tecnologia e videojogos, criando artigos que procuram dar-lhe a informação que necessita numa linguagem compreensível para todos.
Se você tiver alguma dúvida, meu conhecimento vai desde tudo relacionado ao sistema operacional Windows até Android para celulares. E meu compromisso é com você, estou sempre disposto a dedicar alguns minutos e te ajudar a resolver qualquer dúvida que você possa ter nesse mundo da internet.

