Em resumo:
- Essa IA tenta desenvolver e executar um projeto inteiro (Terminal, IDE, navegador e uma tela de pré-visualização do código) sozinha, somente com prompts de seres humanos, e, conforme tem erros, o Devin pode pesquisar o erro na internet e, se encontrar a solução num site, já aplica a correção no código, tudo isso sem envolvimento humano. Consegue encontrar também erros no ambiente de desenvolvimento;
- A IA ainda está em testes e não foi lançada, porém já é possível entrar em contato com a Cognition para enviar uma requisição de acesso ao Devin.
Devin foi avaliado no desafiador benchmark SWE-bench e a IA demonstrou uma capacidade notável de resolver problemas do mundo real, como questões encontradas em projetos de código aberto como Django e scikit-learn.
Surpreendentemente, Devin conseguiu resolver corretamente 13,86% das questões, um salto considerável em relação ao recorde anterior de 1,96%. Mesmo quando fornecido com os arquivos exatos para editar, modelos anteriores só conseguiam resolver 4,80% das questões. É importante notar que Devin foi avaliado sem assistência, enquanto todos os outros modelos receberam ajuda, sendo informados exatamente quais arquivos precisavam ser editados. O projeto conseguiu um investimento inicial de $21 milhões liderado pela Founders Fund.
Habilidades de Devin:
- Devin pode aprender como usar tecnologias desconhecidas;
- Devin pode criar e implantar aplicativos de ponta a ponta;
- Devin pode encontrar e corrigir bugs em bases de código de forma autônoma;
- Devin pode treinar e ajustar seus próprios modelos de IA;
- Devin pode solucionar bugs e solicitações de recursos em repositórios de código aberto;
- Devin pode contribuir para repositórios de produção maduros.
Sobre Cognition
É um laboratório de IA aplicada focado no raciocínio. Estão focando esforços na construção de companheiros de equipe de IA com capacidades muito além das ferramentas de IA existentes atualmente.
Link do artigo original:
https://www.cognition-labs.com/blog