Connect with us

Tech

Google Gemini 1.5 Pro é um modelo novo e mais eficiente de inteligência artificial

Published

on

Google Gemini 1.5 Pro é um modelo novo e mais eficiente de inteligência artificial

Quinta-feira Google revelar Gemini 1.5 Pro, que a empresa descreve como oferecendo “desempenho significativamente melhorado” em comparação com o modelo anterior. O caminho da IA ​​da empresa – visto internamente como crítico para o seu futuro – segue-se ao lançamento do Gemini 1.0 Ultra na semana passada, juntamente com a mudança de marca do chatbot Bard (para Gemini) para se alinhar com as capacidades mais poderosas e versáteis do novo modelo.

Em uma postagem de anúncio no blog, o CEO do Google, Sundar Pichai, e o CEO do Google DeepMind, Demis Hassabis, tentam equilibrar a garantia de seu público sobre a segurança ética da IA, ao mesmo tempo que promovem as capacidades de seus modelos em rápida evolução. “Nossas equipes continuam a ultrapassar os limites dos nossos modelos mais recentes com a segurança em sua essência”, resumiu Pichai.

A empresa precisa enfatizar a segurança dos céticos da IA ​​(incluindo um ex-executivo do Google) e dos reguladores governamentais. Mas também precisa enfatizar o desempenho acelerado de seus modelos para desenvolvedores de IA, clientes em potencial e investidores que temem que a empresa tenha sido muito lenta para responder ao sucesso da OpenAI com o ChatGPT.

Pichai e Hassabis dizem que o Gemini 1.5 Pro oferece resultados semelhantes aos do Gemini 1.0 Ultra. No entanto, o Gemini 1.5 opera neste nível de forma mais eficiente, com menores requisitos computacionais. Os recursos multimídia incluem processamento de texto, imagens, vídeos, áudio ou código. À medida que os modelos de IA avançam, eles continuarão a oferecer um conjunto mais diversificado de capacidades em uma única caixa de reivindicação (outro exemplo recente é a integração do OpenAI para gerar imagens DALL-E 3 no ChatGPT).

READ  LastPass diz que nenhuma senha foi hackeada após um susto de hack

CEO do Google, Sundar Pichai (Alain Jockard via Getty Images)

O Gemini 1.5 Pro também pode lidar com até 1 milhão de tokens, ou seus módulos de modelagem de dados alimentados por IA podem processá-los em uma única solicitação. O Google afirma que o Gemini 1.5 Pro pode processar mais de 700.000 palavras, uma hora de vídeo, 11 horas de áudio e bases de código com mais de 30.000 linhas de código. A empresa afirma ter “testado com sucesso” uma versão que suporta até 10 milhões de tokens.

A empresa afirma que o Gemini 1.5 Pro mantém alta precisão em consultas com maior número de tokens quando tem mais dados novos para aprender. Ela diz que gostou do modelo Avaliação de agulha em palheiro. Neste teste, os desenvolvedores inserem uma pequena informação dentro de um longo bloco de texto para ver se o modelo de IA consegue capturá-la. O Google disse que o Gemini 1.5 Pro pode encontrar texto incorporado 99% do tempo em blocos de dados de até 1 milhão de tokens.

O Google diz que o Gemini 1.5 Pro pode refletir sobre vários detalhes das transcrições da missão lunar Apollo 11 de 402 páginas. Além disso, ele pode analisar pontos da trama e eventos de um filme mudo de 44 minutos estrelado por Buster Keaton. “Como a longa janela de contexto do 1.5 Pro é a primeira do tipo entre modelos de grande escala, estamos constantemente desenvolvendo novas avaliações e benchmarks para testar suas novas capacidades”, escreveu Hassabis.

Google lança Gemini 1.5 Pro com capacidade de 128.000 tokens mesmo número É aí que os modelos GPT-4 da OpenAI (anunciados publicamente) atingem seu limite. Hassabis diz que o Google acabará introduzindo novos níveis de preços que suportam até 1 milhão de consultas únicas.

READ  A última queda de pixel do Google adiciona vídeo macro, planos de fundo cinematográficos e muito mais
NOVA IORQUE, NOVA IORQUE - 02 DE MAIO: Demis Hassabis participa do 2023 Future of Everything Festival no WSJ no Spring Studios em 02 de maio de 2023 na cidade de Nova York.  (Foto de Joy Malone/Getty Images)

CEO do Google DeepMind, Demis Hassabis (Joy Malone via Getty Images)

O Gemini 1.5 Pro também é adepto do aprendizado de novas habilidades a partir de informações em longos prompts – sem ajustes adicionais (“aprendizado no contexto”). Em um padrão chamado Tradução automática de um livro,A modelo aprendeu um guia gramatical para Kalamang, uma língua falada por menos de 200 falantes em todo o mundo e na qual nunca havia sido treinada antes. A empresa afirma que o Gemini 1.5 Pro aprende o desempenho em um nível semelhante ao que um ser humano aprende o mesmo conteúdo ao traduzir do inglês para Kalamang.

Em uma parte do anúncio que chamará a atenção dos desenvolvedores, o Google afirma que o Gemini 1.5 Pro pode realizar tarefas de resolução de problemas em blocos de código mais longos. “Quando recebem um prompt contendo mais de 100.000 linhas de código, eles podem raciocinar melhor por meio de exemplos, sugerir modificações úteis e fornecer explicações sobre como funcionam diferentes partes do código”, escreveu Hassabis.

No que diz respeito à ética e à segurança, o Google afirma que está adotando “a mesma abordagem para a publicação responsável” que fez com os modelos Gemini 1.0. Isto inclui o desenvolvimento e aplicação de técnicas de red teaming, onde um grupo de desenvolvedores éticos atuam essencialmente como advogados do diabo, testando “uma série de danos potenciais”. Além disso, a empresa afirma que realiza um exame minucioso em áreas como integridade de conteúdo e danos representacionais. A empresa afirma que continua a desenvolver novos testes éticos e de segurança para as suas ferramentas de IA.

O Google lança acesso antecipado ao Gemini 1.5 para desenvolvedores e clientes corporativos. A empresa planeja eventualmente torná-lo mais amplamente disponível. Atualmente, o Gemini 1.0 está disponível para os consumidores, juntamente com um Alternativa profissional Que custa $ 20 por mês.

READ  Grand Theft Auto V Mod para PC é semelhante ao Grand Theft Auto VI
Continue Reading
Click to comment

Leave a Reply

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Tech

A Take-Two está supostamente fechando OlliOlli e Kerbal Space 2 Devs

Published

on

A Take-Two está supostamente fechando OlliOlli e Kerbal Space 2 Devs
Imagem: Roll7, Seção Especial

Já houve uma quantidade recorde de perdas de empregos na indústria de jogos este ano, e essa tendência infelizmente parece destinada a continuar com a Bloomberg anunciando o fechamento de mais dois estúdios.

De acordo com “documentos revisados ​​​​pela Bloomberg”, a Take-Two Interactive Software anunciou que fechará sua divisão privada com sede em Londres e subsidiária Roll7 (olê olê, Rollerdrome) e a Programa espacial Kerbal 2 Desenvolvedor Intercept Games, com sede em Seattle.

“A primeira empresa é a Roll7, com sede em Londres, uma desenvolvedora de jogos de ação Rollerdrome, de acordo com um memorando à equipe. A Take-Two planeja fechar o estúdio e oferecerá acordos de rescisão aos seus funcionários.

“A outra é a Intercept Games, com sede em Seattle, criadora do jogo de simulador de vôo espacial Programa espacial Kerbal 2, de acordo com um aviso apresentado ao Departamento de Segurança do Trabalho do Estado de Washington na segunda-feira. O aviso revelou que a Take-Two planeja fechar um escritório em Seattle e cortar 70 empregos, ou aproximadamente o número de pessoas que trabalhavam na Intercept Games.

De acordo com o vice-presidente de comunicações da Take-Two, o Kerbal Space Program 2 continuará recebendo atualizações.

Esta última rodada de demissões vem na esteira de muitas outras histórias semelhantes este ano, incluindo algumas maiores e menores – desde demissões em massa na Microsoft e na Sony até o cancelamento de projetos em equipes menores.

Continue Reading

Tech

A parceria Microsoft OpenAI nasceu da inveja do Google

Published

on

A parceria Microsoft OpenAI nasceu da inveja do Google

Acontece que o cenário atual da IA ​​pode ser atribuído ao medo, ao ciúme e à intensa ambição capitalista. Os e-mails revelados no caso antitruste do Departamento de Justiça contra o Google, primeiro mencionado por Interessado em comércio, mostra executivos da Microsoft expressando seu aborrecimento e inveja com o progresso do Google em inteligência artificial. Isto criou uma urgência que levou a fabricante do Windows a fazer um investimento inicial de mil milhões de dólares no seu agora indispensável parceiro, OpenAI.

Em uma série de e-mails de 2019 fortemente editada intitulada “Reflexões sobre OpenAI”, o CEO da Microsoft, Satya Nadella, envia uma longa carta do CTO Kevin Scott para a CFO Amy Hood. “Um e-mail muito bom explicando por que quero que façamos isso… e também por que garantiremos que nossa equipe de infraestrutura faça isso”, escreveu Nadella.

Scott escreveu que estava “profundamente preocupado” com o rápido crescimento das capacidades de IA do Google. Ele diz que inicialmente rejeitou os “jogos emocionantes” da empresa, provavelmente uma referência aos modelos AlphaGo do Google. Um deles venceu o campeão mundial Go Ke Jie em 2017, feito impressionante para a época. (Modelos posteriores do Google foram além desse modelo, eliminando completamente a necessidade de treinamento humano.)

Mas Scott diz que ignorar o progresso do Google nos jogos “foi um erro”. “Quando eles assumiram toda a infraestrutura que construíram [natural language] “Modelos que não podíamos replicar facilmente começaram a levar as coisas mais a sério”, escreveu Scott. “À medida que me aprofundei na tentativa de entender onde estavam todas as lacunas de capacidade entre o Google e nós em termos de treinamento modular, fiquei muito, muito preocupado.”

READ  Grand Theft Auto V Mod para PC é semelhante ao Grand Theft Auto VI
O CTO da Microsoft, Kevin Scott, faz uma apresentação no palco em frente a uma parede azul com o logotipo da Microsoft.  As cabeças do público estão desfocadas em primeiro plano.

CTO da Microsoft, Kevin Scott (Microsoft)

Scott conta como a Microsoft lutou para copiar o grande modelo BERT do Google, o modelo de IA que decodifica o significado e o contexto das palavras em uma frase. Scott culpou os saltos na infraestrutura feitos por seu concorrente, o que a Microsoft não fez.

“Acontece que simplesmente replicar o grande modelo BERT não foi fácil para nós. “Mesmo tendo o modelo implementado, levamos aproximadamente 6 meses para treiná-lo porque nossa infraestrutura não estava à altura da tarefa”, disse o CTO da Microsoft. escreveu “O Google já tinha BERT há pelo menos seis meses antes disso, então, no tempo que levamos para hackear juntos a capacidade de treinar um modelo de parâmetros de 340M, eles tiveram um ano para descobrir como colocá-lo em produção e seguir em frente. modelos mais amplos e interessantes.

Ele também expressou sua admiração e inveja pelos recursos de preenchimento automático do Gmail do Google, dizendo que eles “se tornaram assustadoramente bons”. Ele comentou que a Microsoft estava “vários anos atrás da concorrência em termos de… [machine learning] Volume.” Ele comentou sobre o crescimento “interessante” do OpenAI, DeepMind e Google Brain.

Scott elogiou as pessoas “muito inteligentes” da Microsoft em suas equipes de aprendizado de máquina, mas disse que suas ambições foram restringidas. “Mas as principais equipes de aprendizagem profunda dentro de cada uma dessas grandes equipes são muito pequenas e suas ambições também foram limitadas, o que significa que mesmo quando começamos a alimentá-las com recursos, elas ainda terão que passar por um processo de aprendizagem para dimensionar o trabalho.” Scott escreveu. “E estamos vários anos atrás da concorrência em termos de escala de aprendizado de máquina.”

READ  A última queda de pixel do Google adiciona vídeo macro, planos de fundo cinematográficos e muito mais

Depois que Hood insistiu que as preocupações de Scott eram “por que quero que façamos isso”, ou seja, investir em OpenAI, a empresa realizou os desejos de seu CEO. A Microsoft investiu US$ 1 bilhão na startup liderada por Sam Altman em 2019, e o resto é uma história em rápida mudança. (Agora investiu US$ 13 bilhões.) É uma tecnologia que faz coisas incríveis, mas que ameaça destruir o mercado de trabalho e dá aos pregadores a sua ferramenta mais poderosa, naquela que já era uma era de desinformação desenfreada.

Continue Reading

Tech

CEO da Rabbit defende AI Doohickey de US$ 200 e diz que ‘não é um aplicativo’

Published

on

CEO da Rabbit defende AI Doohickey de US$ 200 e diz que ‘não é um aplicativo’

Coelho R1 Ele não tem muitas habilidades Que o seu telefone já possui. Ele não envia e-mails para você. Não é possível definir lembretes ou alarmes no calendário. Ele não pode se conectar a nenhum aplicativo fora dos quatro aplicativos específicos que incluem Spotify, Uber, DoorDash e Midjourney. Todos esses recursos podem vir no futuro, mas se você está se perguntando por que não é apenas mais um aplicativo de IA, alguns blogueiros de tecnologia conseguiram fazer exatamente isso pegando uma versão vazada do APK do Rabbit e executando-a no Android com relativamente poucos recursos. um esforço. Agora, o CEO do Rabbit, Jesse Liu, saiu para defender o código “personalizado” do doohickey de US$ 200 que requer o próprio hardware do Rabbit.

Como o Pin de IA humana no valor de US$ 700 Antes disso, as primeiras análises do pequeno coelho laranja R1 e seu assistente de IA não eram exatamente brilhantes. No entanto, o blogueiro de tecnologia Mishal Rahman vai um passo além Corpo do robô Ele alegou que ele e sua equipe conseguiram fazer o Rabbit OS rodar no Pixel 6. Isso estava usando um arquivo APK supostamente vazado, que Rahman conseguiu traduzir diretamente em um aplicativo Android.

Coelho R1 no telefone

A tela do Rabbit R1 tem apenas 2,88 polegadas e tem uma resolução tão baixa que só aparece no canto superior da tela do Pixel 6. Enquanto respondia a uma pergunta básica, Rahman não testou se a visão do coelho ou as funções do aplicativo funcionavam. o telefone. No entanto, o Android Authority afirmou que pode fazer login em sua conta Rabbithole (a conta principal do seu R1), que pode então se conectar ao que parece ser a mesma IU que o Rabbit usa.

READ  As estatísticas do “Nintendo Switch 2023 Year in Review” já estão disponíveis

O Gizmodo entrou em contato com Rabbit para comentar na manhã de quarta-feira, horário do leste dos EUA, e fomos direcionados a uma declaração de Lyu que diz:

“Rabbit r1 não é um aplicativo Android. Estamos cientes de que existem alguns emuladores de aplicativos/sites não oficiais para Rabbit OS. Entendemos a ansiedade que as pessoas sentem em experimentar nossa IA e LAM em vez de esperar a chegada de seu r1. No entanto, , para esclarecer qualquer mal-entendido e esclarecer as coisas, Rabbit OS e LAM são executados na nuvem com AOSP muito detalhado e modificações de firmware de nível inferior, portanto, um APK local ilegal sem o sistema operacional adequado e os endpoints de nuvem não serão capazes de acessar nosso serviço O Rabbit OS é personalizado para r1 e não oferecemos suporte a clientes de terceiros além do OTA. Hoje, implementamos várias melhorias de verificação na nuvem para validar solicitações de dispositivos/clientes. Reservamos todos os direitos em relação a quaisquer atividades maliciosas e ilegais de segurança cibernética em relação aos nossos serviços.

Para explicar o que isso significa, Rabbit diz que seu dispositivo roda no código-fonte modificado do Android Open Source Project e que seu sistema operacional roda na nuvem com o firmware fazendo trabalho extra no dispositivo. Ao que parece, Rahman teve acesso a algumas funcionalidades do Rabbit que simplesmente conectam o dispositivo aos servidores em nuvem que executam os modelos de IA, embora seja provável que ele não tenha acesso a todos os recursos do Rabbit. Poucas horas depois da publicação do artigo de Rahman chilro Que a versão Pixel 6 de seu Rabbit não se conectará mais, o que parece confirmar a declaração de Lyu sobre o novo requisito de verificação do usuário.

READ  A última queda de pixel do Google adiciona vídeo macro, planos de fundo cinematográficos e muito mais

Embora ainda não esteja claro onde Rahman recebeu o arquivo APK, ele estava lá Link Está circulando há algumas semanas sobre o que deveria ser o código-fonte vazado do Rabbit. Esses vazadores descreveram a promessa do coelho como uma “mentira descarada”, alegando que o dispositivo estava simplesmente executando vários scripts de automação e que a conexão do aplicativo só funcionava em uma máquina virtual.

Mas vamos ignorar a controvérsia do “coelho” do Android. Esse não é realmente o ponto. Como o próprio mais gracioso Ele disseMuitas startups lançam seus projetos contando com um bom AOSP com dispositivos que já suportam o ecossistema Android. O Rabbit funciona em um Mediatek Helio P35 MT6765, uma CPU móvel baseada em ARM de cinco anos que pode suportar um rádio LGE com velocidades de download de até 300 Mbps. Isso é ruim? Não, não necessariamente. O Coelho não está mentindo sobre o que o Coelho pode fazer, mas a pergunta que devemos fazer é se ele faz algo que afirma ser bom o suficiente para justificar o preço pedido.

O dispositivo custa apenas US$ 200 em comparação com o Humane Pin, de US$ 700, em parte devido ao software de código aberto combinado com hardware mais barato. O problema não é que o Rabbit esteja de alguma forma enganando as pessoas com um telefone falso, é que o Rabbit parece ter tido que esperar antes de lançar seu primeiro produto. O Gizmodo descobriu que a duração da bateria do dispositivo era muito baixa, mas ontem – menos de uma semana após seu lançamento – o Rabbit lançou uma atualização que afirma aumentar a vida útil da bateria várias vezes.

Nós do Gizmodo passamos apenas 24 horas com ele e já achamos o dispositivo muito limitado no que pode fazer. Ele pode responder a perguntas básicas e fornecer mais nuances para algumas dúvidas do que o Siri. Ele também possui recursos básicos de visão que podem responder a algumas perguntas sobre o seu ambiente, mas mesmo esses recursos parecem difíceis. Transformei em estilo selfie e pedi ao coelho que me descrevesse. De acordo com Coelho R1, eu tenho barba (correto, A+, sem feedback), mas ela também me disse que eu estava usando uma camisa vermelha, embora estivesse usando minhas roupas pretas desbotadas. Ele não tem capacidade de GPS, mas peça seu CEP atual e ele lhe dirá com segurança que você está a quilômetros de onde está. Eu ficaria muito preocupado em perguntar a ele qualquer informação importante, como onde fica o hospital mais próximo.

READ  O que a sopa de Zelda nos diz sobre as empresas japonesas?

Conectar-se ao Spotify ou outros aplicativos é um grande incômodo que é agravado pelo fato de os principais controles do dispositivo serem a sua voz e um único botão localizado na lateral. Peça para pular uma música que está tocando e o Rabbit perguntará qual música você deseja pular. Obviamente a resposta deveria ser “a música que estou ouvindo no momento”.

Minha colega Dua Rasheed terá toda a sua opinião sobre o Rabbit R1 esta semana, mas depois de usá-lo brevemente, posso dizer que se fosse um aplicativo, eu não me incomodaria em baixá-lo.

Continue Reading

Trending

Copyright © 2023