A Inteligência Artificial vai explodir em 2024
O próximo ano será aquele em que as ferramentas de Inteligência Artificial irão influenciar quase todas as facetas do dia a dia. Muitas vezes, nem vamos dar por isso.
Este 2024 vai ser o ano da consagração da Inteligência Artificial generativa”, como o famoso ChatGPT e outras ferramentas. Quem o diz é Manuel Dias, diretor Nacional de Tecnologia da Microsoft. “Vai atingir o mercado de forma massiva. Vemos muita, muita apetência de utilização pelo lado de utilizadores, universidades, empresas e entidades do setor público”, afirma o especialista, que também é membro da comissão executiva da em presa em Portugal.
Este tipo de tecnologia, em que a IA é capaz de gerar conteúdo original - texto, imagem, som, etc. - em resposta às solicitações dos utilizadores, é já uma realidade com possível utilização diária para qualquer pessoa com um equipamento ligado à internet, como realça Manuel Dias no podcast do DN Tech&Café, a emitir nos próximos dias, mas irá invadir todas as áreas de serviços progressivamente, mesmo que não demos por isso.
A Microsoft e o seu Bing e Co-Pilot
A integração pela Microsoft das ferramentas de IA da OpenAI - ChatGPT, Dall-E… - nos seus produtos tem dado frutos que estão ainda só a começar a amadurecer. Ao incluir o GPT no motor de busca Bing - e este último no navegador (browser) Edge - a empresa de Redmond tornou-se pioneira em facultar esta forma de pesquisa na internet ao grande público.
Hoje, o Edge é capaz de “ler” e sintetizar em língua corrente um qualquer documento pdf que lhe seja carregado a partir do nosso computador, por exemplo, e a partir daí até sugerir que outras fontes de informação podem ser utilizadas. O chatbot integrado no browser é mesmo capaz de responder a perguntas sobre o(s) documento(s) que estamos a estudar, o que é uma excelente ferramenta para tirar dúvidas. Tudo rapidamente e de forma gratuita.
Este tipo de processo - que já acontece no Bing via ChatGPT 4 - está permanentemente a ser melhorado: de início estava limitado a texto, hoje em dia já evoluiu para imagens. Estas ferramentas estão a aprender a reconhecer tanto fotos, como vídeos (ler mais à frente, no capítulo da Google), bem como a melhorar as suas capacidades de geração de imagens fotorrealistas originais a partir de solicitações (prompts) dos utilizadores. Esta é, aliás, outra das funcionalidades disponibilizadas de forma gratuita pela Microsoft: basta entrar no Bing Image Creator através de um browser e descrever que imagem se pretende. A IA (cujo algoritmo é o mesmo por trás do Dall-E da OpenAI) cria em poucos segundos sugestões diferentes, à escolha.
Sempre focado na “produtividade”, o gigante americano de softwarecentra a IA na sua suite de produtos pagos Microsoft 365 (antigo Office 365), que inclui os populares Word, Excel, Outlook, PowerPoint, etc., em ferramentas auxiliares a que genericamente chamou Co-Pilot. Trata-se de ajudantes digitais específicos para cada um destes programas, com funções que variam desde auxiliar a escrever um e-mail, a resumir um texto do Word, passando por sugerir slides no PowerPoint. Como sintetiza Manuel Dias: “Eu não vou estar a decorar os 300 menus do Excel! Eu quero é escrever no Co-Pilot aquilo que pretendo e que a ferramenta aprenda por mim e faça aquilo que eu quero.”
Noutra vertente, também as organizações, públicas e privadas, estão a apostar em contratar serviços de IA para facilitar o seu próprio dia a dia. A Microsoft já desenvolveu um programa de “atendimento ao público” para o Ministério da Justiça baseado ao ChatGPT, “para responder a perguntas dos cidadãos sobre casamentos, sobre divórcios”, lembra Manuel Dias, “e hoje em dia já há também [um] sobre a criação de empresas na hora”.
Este tipo de soluções serão ainda mais comuns no futuro próximo - até porque há mais projetos em desenvolvimento -, com os utentes e clientes de empresas a serem muitas vezes atendidos por IA. “Já fizemos um projeto com a Agência de Modernização Administrativa, onde usamos avatares gerados pela IA”, lembra o responsável da Microsoft Portugal. Afinal, “onde há um serviço onde eu posso ligar e estar a ver um avatar, ou se quiser usar outra língua, falar no telemóvel e ter um GPT a falar essa língua, isso é maior inclusão”, refere Manuel Dias.
A Google e o seu Gemini e o Assistente Digital
Isso mesmo é o que a Google já hoje faz na sua linha de telemóveis Pixel com o Assistente Digital, nos EUA e noutros países de expressão inglesa. Em Portugal, a limitação ainda é a língua, mas espera-se que, em breve, esse obstáculo seja solucionado.
Em funcionamento, o sistema já se assemelha um pouco a ter um(a) secretário(a) pessoal no bolso. O telemóvel atende (literalmente) a chamada telefónica se o sistema reconhecer tratar-se de uma chamada não-solicitada - de marketing/vendas, por exemplo. A IA responde como se de uma pessoa se tratasse, avisando o interlocutor de que “está a falar com um sistema automático de atendimento e o utilizador que pretende contactar não se encontra disponível no momento”. De seguida, pergunta qual o assunto, de forma a avaliar se deve ou não transferir a chamada. A IA é capaz de manter o diálogo de forma credível, incluindo perguntar a identificação de quem telefona, qual o assunto, a empresa, etc., sempre com vocabulário corrente. E avalia sozinha se a chamada necessita, de facto, de intervenção humana: por exemplo, caso se trate de uma mera remarcação de uma consulta para os dias seguintes, que implique uma simples alteração no calendário, o Assistente limita-se a fazer o ajuste, agradece e desliga, avisando o utilizador por notificação escrita, para que este não seja incomodado mais do que o mínimo necessário. Esperemos que a Google traga este serviço depressa para o nosso português!
Apresentada este último trimestre, a mais recente versão pública dos módulos de IA generativa da Google, batizada Gemini, inclui ainda evoluções de monta ao nível da compreensão e de tratamento de imagem.
O caso tornou-se primeiro viral - e depois um pouco polémico - no início deste mês de dezembro, quando a Google divulgou um vídeo aparentemente revelando as capacidades de reconhecimento e “raciocínio” do Gemini a partir de pistas visuais. Ao que parecia, a IA era capaz de rapidamente “ver” e responder, adivinhando o significado de desenhos feitos à mão, por exemplo. Só que…
Veio depois a saber-se que o vídeo foi editado “por questões de rapidez”, admitiu a própria Google. Afinal, o Gemini não é assim tão rápido a responder e, como previam muitos especialistas, o melhor chatbot da Google estará sensivelmente ao mesmo nível do ChatGPT 4 - que também é capaz de “ver” fotos e vídeos e compreendê-los, como referimos. Ou seja, um vence em alguns parâmetros, outro ganha noutros.
Enquanto Microsoft/OpenAI e Google estão nesta “corrida ao armamento” da IA generativa quem ganha são aqueles que utilizam os produtos de ambas as empresas, que vão recebendo atualizações de produtos cada vez mais sofisticados.
É o caso das atualizações de dezembro dos smartphones Pixel 8, da Google, que incluíram mais algumas funcionalidades que, seguramente, veremos serem “copiadas” por outros fabricantes.
Desde logo destaca-se a identificação e transcrição automática de gravações áudio no Gravador (que funciona de forma quase perfeita em inglês, mas precisa de melhoramentos em português - esperamos que surjam ao longo de 2024); um Photo Unblur ainda mais capaz de recuperar fotos desfocadas; ferramentas de edição de imagem ainda mais eficazes, em que não apenas é extremamente fácil manipular os elementos da foto, incluindo apagar até pessoas da mesma, com a IA a conseguir preencher o espaço que fica em falta de forma eficiente em segundos.
Por fim, de realçar o novo modo de vídeo noturno, excecionalmente eficiente a captar detalhes, mesmo sob condições de pouca luz, que tem apenas o defeito de necessitar de processamento “na nuvem” da Google, com a consequente demora de upload/download (e disponibilidade do sis- tema). Mas mesmo aqui, o gigante do software mostra-nos já o que serão os nossos smartphones do futuro: aparelhos híbridos que até nem precisam de ter o hardware mais rápido do mundo - basta correrem um conjunto de rotinas de IA localmente, deixando o grosso do trabalho “pesado” para os servidores algures no mundo. Haja 5G (ou melhor) estável o suficiente para que a informação navegue pelo éter.
Muita inovação portuguesa a chegar
O próximo ano verá também surgir no mercado inovação portuguesa que tem vindo a ser desenvolvida pelas empresas do Center for Responsible AI, que é um dos maiores centros do mundo dedicados a criar Inteligência Artificial de forma responsável e junta mais de 20 entidades, incluindo startups, grandes empresas e centros de pesquisa quer públicos, quer privados.
Um deles é o Halo, criado em primeira linha pela Unbabel, em parceria com o Hospital de São João, no Porto, que junta IA generativa e interfaces neuronais não-invasivas com o objetivo de restaurar a comunicação em pacientes que a perderam devido a doen- ça neurodegenerativa, como a Esclerose Lateral Amiotrófica. O sistema é capaz, através de aparelhos como óculos e fones, de reconhecer o ambiente em redor e as pessoas que se dirigem ao doente. Este, em contrapartida, pode comunicar com maior facilidade via uma persona gerada por IA baseada na sua própria pessoa, enviando, por exemplo, mensagens de voz sintetizada com base naquilo que foi a sua voz natural. Neste fim de ano, um paciente já o está a utilizar, como programa-piloto, devendo a experiência começar a ser alargada a outros doentes.
Outro programa da mesma empresa portuguesa - e inovador num sentido completamente diferente - é o Cultural-Aware Multilingual Customer Service, que visa resolver um dos problemas que se colocam no atendimento ao público internacional das empresas: é que não basta traduzir a língua, é preciso adaptar a linguagem à cultura do interlocutor. Há formas de tratamento mais ou menos formais, expressões idiomáticas ou coloquialismos que podem ser mais ou menos bem aceites, consoante a região do globo para a qual estamos a falar, e esta IA funciona como filtro corrigindo o texto no chat em tempo real de forma a evitar mal-entendidos.
Já a startup NeuralShift deverá comercializar no próximo ano o Affine Knowledge Discovery, um sistema de IA que, simplisticamente, é uma espécie de “Google para advogados ou juristas”. O sistema conhece toda a legislação portuguesa, através de acesso a bases de dados jurídicas públicas e não-públicas, e não apenas permite fazer pesquisas no seu interior, como está treinado para fazer sínteses dos documentos e responder a perguntas sobre a legislação aplicável a casos concretos e deduzir interações entre disposições legais.
Estes são apenas alguns exemplos de como, tal como referimos, a IA já está a entrar, progressivamente, no dia a dia das pessoas, em todas as vertentes. As ferramentas digitais que criamos para “ler” e “ver” o mundo estão cada vez mais capazes e, com isso, podem ajudar-nos a completar as tarefas diárias mais eficientemente.
“Este é o ano em que se calhar vamos deixar de escrever e vamos estar a falar com o telemóvel em linguagem natural”, vaticina Manuel Dias. E, é claro, grande parte da qualidade das respostas que obtivermos dependerá daquilo que perguntarmos.