Modelo mais pequeno deepseek r1 foi atualizado e já bate o gemini 2. 5 flash em teste de benchmark

Tek

Modelo mais pequeno deepseek r1 foi atualizado e já bate o gemini 2. 5 flash em teste de benchmark"


Play all audios:

Loading...

A startup chinesa DeepSeek continua a refinar o seu modelo de inteligência artificial, nomeadamente a versão destilada R1, que recebeu uma nova atualização. A versão foi denominada de


DeepSeek-R1-0528-Qwen3-8B e é apontada como menor e mais resumida. No entanto, os resultados dos testes de benchmark AIME 2025 mostram que este é EXTREMAMENTE EFICIENTE E ENCOSTA-SE AO


OPENAI 03, ULTRAPASSANDO EM DESEMPENHO O MAIS RECENTE MODELO DA GOOGLE, O GEMINI 2.5 FLASH. Talvez o que seja mais surpreendente é que esta versão do DeepSeek R1 precise de menos recursos de


hardware para funcionar. SEGUNDO O TECHCRUNCH, ESTA VERSÃO DO R1 UTILIZA COMO BASE O QWEN3-8B DA ALIBABA E PRECISA DE UMA NVIDIA H100 PARA OPERAR, COM APENAS UM GPU COM 40 A 80 GB DE RAM


PARA CORRER. Em comparação, segundo a plataforma de cloud NodeShift, a versão completa DeepSeek R1 necessita de cerca de uma dúzia de GPUs com 80 GB para funcionar. A DeepSeek treinou o novo


modelo utilizando texto gerado pela versão atualizada do R1 para o refinar. A STARTUP EXPLICA NO HUGGING FACE QUE ESTA ATUALIZAÇÃO MELHORA SIGNIFICATIVAMENTE A SUA PROFUNDIDADE DE


RACIOCÍNIO E CAPACIDADES DE INFERÊNCIA, ao aproveitar o aumento dos recursos computacionais e introduzindo mecanismos de otimização dos algoritmos no pós-treino. O NOVO MODELO DEMONSTROU UMA


ELEVADA PERFORMANCE ENTRE DIFERENTES AVALIAÇÕES DO BENCHMARK, INCLUINDO MATEMÁTICA, PROGRAMAÇÃO E LÓGICA GERAL. “A sua performance geral está agora a aproximar-se dos modelos líderes, como


o O3 e o Gemini 2.5 Pro”, aponta na sua publicação. Refere ainda que o DeepSeek-R1-0528-Qwen3-8B pode ser usado tanto na investigação académica nos modelos de raciocínio como no


desenvolvimento industrial focado em modelos de pequena escala. DE NOTAR QUE O MODELO ESTÁ DISPONÍVEL ATRAVÉS DE UMA LICENÇA MIT, PODENDO SER USADA EM PRODUTOS COMERCIAIS SEM RESTRIÇÕES,


apontando apenas o disclaimer de utilização.


Trending News

Interdição do túnel da ponte de ferro é suspensa nesta quarta-feira

A interdição do túnel da Ponte de Ferro (Aldo Pereira de Andrade), na Ponta Aguda, foi suspensa pela Prefeitura de Blume...

8 em ponto: entrevista com charles lamb

Começa nesta quarta-feira (31), no Centro de Ciências Agrárias da UFSC, a Semana Nacional do Alimento Orgânico. E para f...

Depois do apito – mauro ferreira

No quinto episódio da Série “Depois do Apito”, o Meio-Dia Esporte conta a história do ex-goleiro Ferreira. Ídolo do Marc...

Página no encontrada - Caraota Digital

NotificaciónInicioVenezuelaVenezuelaMostrar MásVecinos de Prados del Este responden a aclaratoria tras denuncia por merc...

Casal nayara justino e cairo jardim vence a segunda edição do power couple brasil com 65. 07% dos votos

Na noite de ontem, quinta-feira, dia 22/06, a RECORD TV realizou, ao vivo, a grande final do reality Power Couple Brasil...

Latests News

Modelo mais pequeno deepseek r1 foi atualizado e já bate o gemini 2. 5 flash em teste de benchmark

A startup chinesa DeepSeek continua a refinar o seu modelo de inteligência artificial, nomeadamente a versão destilada R...

Rússia reivindica tomada de localidade na região ucraniana de sumy

A Rússia afirmou, neste domingo (1º), ter tomado uma localidade na região de Sumy, no nordeste da Ucrânia, onde Kiev tem...

Reação: torcida do fluminense se surpreende com time do flamengo | coluna do fla

[embedded content] O Flamengo está classificado para a semifinal do Campeonato Carioca Superbet 2025, e os rivais já est...

Como gerar imposto de empresa no lucro presumido que não tem emissão de nota fiscal de venda. - tributos federais

FÓRUM CONTÁBEIS TRIBUTOS FEDERAIS respostas _2_ acessos _426_ Wagner Rodrigues de Souza _Prata DIVISÃO 1 , COORDENADOR(A...

Colapso de duas pontes em intervalo de horas deixa mortos na rússia

Ao menos sete morreram e dezenas ficaram feridos em incidentes envolvendo trens em duas regiões que fazem fronteira com ...

Top