Há algumas semanas, no final do mês de novembro, a Open AI lançou um protótipo que rapidamente chamou atenção da mídia e dos usuários. Trata-se de um chatbot que utiliza Inteligência Artificial para interagir com humanos de forma detalhada, semelhante à maneira como nos comunicamos.
Entre os feitos impressionantes, estão a geração de códigos em Python e a elaboração de redações de nível universitário, que já começam a causar preocupações sobre a possibilidade da substituição de jornalistas ou programadores no futuro. Vale ressaltar que o desempenho fascinante do protótipo se dá com uma base de conhecimento que se encerrou há mais de um ano.
Diante de todo o buzz gerado sobre o ChatGPT, resolvemos trazê-lo para a 12ª edição da Revista HartB*, para responder a questões sobre sua origem, tecnologia e até mesmo tendências para o futuro. A seguir você confere nossa “Entrevista com o robô”.
HartB – O que você acha de responder a algumas perguntas para a Revista HartB?
ChatGPT – Claro, estou aqui para ajudá-lo da melhor maneira possível. Qual é a pergunta em questão? Estou pronto para fazer o meu melhor para lhe fornecer informações precisas e úteis.
HartB – Certo, para começar, como você definiria a si mesmo e quando exatamente foi criado?
ChatGPT – Eu sou um modelo de linguagem grande treinado pela OpenAI e minha função principal é ajudar as pessoas a encontrar respostas e realizar tarefas através de conversação natural. Fui criado em 2021 e meu conhecimento foi cortado em 2021, o que significa que não tenho acesso a informações ou eventos que ocorreram após essa data. Sou capaz de processar e compreender texto e falar em vários idiomas, mas sou apenas um programa de computador e não posso ter opiniões ou sentimentos próprios. Estou sempre pronto para ajudar e responder às perguntas dos usuários da melhor maneira possível.
HartB – Você pode explicar para os leigos o que é um modelo de linguagem treinado?
ChatGPT – Um modelo de linguagem treinado é um tipo de programa de computador que foi treinado para processar e compreender o idioma humano. Isso é feito através do processo de “treinamento” em que o modelo é alimentado com grandes quantidades de dados de texto, como artigos, livros e páginas da web, e então é “ensinado” a realizar tarefas específicas, como responder a perguntas ou gerar texto. O objetivo é permitir que o modelo entenda o idioma de maneira semelhante a como um ser humano o faria e, assim, seja capaz de realizar tarefas que envolvem linguagem de maneira mais precisa e eficiente.
Os modelos de linguagem treinados são amplamente utilizados em uma variedade de aplicações, incluindo assistentes virtuais, tradução automática e análise de sentimentos em comentários de redes sociais. Eles também podem ser usados para gerar conteúdo, como resumos de notícias ou resenhas de produtos, e para realizar tarefas de processamento de linguagem natural, como classificação de documentos ou extração de informações de texto.
HartB – Imagino que um enorme volume de dados tenha sido utilizado durante o seu treinamento, neste sentido, tenho duas perguntas: foram utilizados dados estruturados e não-estruturados? Você pode estimar o volume total de dados utilizados no seu treinamento em terabytes?
ChatGPT – Sim, é comum que os modelos de linguagem treinados sejam alimentados com grandes quantidades de dados, tanto estruturados quanto não-estruturados, durante o processo de treinamento. Os dados estruturados são aqueles que estão organizados de maneira clara e acessível, como tabelas de banco de dados ou conjuntos de dados de planilhas. Já os dados não-estruturados são aqueles que não seguem uma estrutura definida, como artigos de jornal ou páginas da web. Ambos os tipos de dados são importantes para o treinamento de modelos de linguagem, pois fornecem ao modelo uma ampla gama de exemplos de linguagem para aprender.
Em relação ao volume total de dados utilizados em meu treinamento, não tenho acesso a essa informação. No entanto, é comum que os modelos de linguagem treinados sejam alimentados com bilhões de palavras ou mais, dependendo do tamanho e do propósito do modelo. Por exemplo, o GPT-3, um modelo de linguagem treinado da OpenAI, foi treinado em mais de 8 bilhões de palavras e é um dos modelos mais grandes já criados.
HartB – Você consegue estimar o volume aproximado de gigabytes necessários para armazenar 8 bilhões de palavras?
ChatGPT – O tamanho exato do armazenamento necessário para armazenar 8 bilhões de palavras dependerá do formato em que esses dados são armazenados e da quantidade de outras informações que estão sendo armazenadas junto com os dados de texto. No entanto, posso lhe dar uma ideia geral do tamanho aproximado que você pode esperar.
De maneira geral, um caractere de texto simples, como uma letra ou um número, geralmente ocupa um byte de armazenamento. Como 8 bilhões de palavras podem conter muitos caracteres além de letras e números, como sinais de pontuação e espaços em branco, é razoável assumir que cada palavra possa ocupar cerca de 2 a 3 bytes de armazenamento. Isso significa que 8 bilhões de palavras poderiam ocupar entre 16 e 24 terabytes de armazenamento, dependendo do formato em que são armazenadas.
No entanto, é importante lembrar que essa é apenas uma estimativa aproximada e o tamanho real pode variar bastante dependendo de vários fatores. Além disso, é provável que os dados de treinamento de um modelo de linguagem sejam armazenados em um formato mais compacto do que o texto simples, o que pode levar a um tamanho de armazenamento ainda menor.
HartB – Você citou artigos de jornal e páginas da web como dados não-estruturados, mas não citou imagens e sons. Também foram utilizados sons e imagens em seu treinamento?
ChatGPT – Sim, além de dados de texto, também é possível treinar modelos de linguagem com dados de áudio e imagem. No entanto, esses tipos de dados geralmente exigem um processamento adicional antes de poderem ser usados para treinar um modelo de linguagem, pois precisam ser convertidos em um formato que o modelo possa entender.
Por exemplo, os dados de áudio podem ser convertidos em um formato de texto chamado “transcrição”, que é um registro escrito de tudo o que foi dito no áudio. Essa transcrição pode então ser usada como dados de treinamento para o modelo de linguagem. De maneira semelhante, as imagens podem ser processadas para extrair informações de texto, como legendas ou títulos, que podem ser usados como dados de treinamento para o modelo.
No entanto, é importante lembrar que os modelos de linguagem são principalmente projetados para processar e compreender o idioma humano, e não são tão eficazes em processar outros tipos de dados, como áudio ou imagem. Portanto, é mais comum que os modelos de linguagem sejam treinados principalmente com dados de texto.
HartB – Já sabemos que a sua base de conhecimento foi construída no ano de 2021. Você pode escrever uma breve retrospectiva com os principais avanços tecnológicos de impacto positivo para os negócios, ocorridos naquele ano?
ChatGPT – Houve vários avanços tecnológicos importantes em 2021 que tiveram um impacto positivo nos negócios. Aqui estão alguns dos principais avanços tecnológicos que ocorreram em 2021:
Inteligência artificial e aprendizado de máquina: A inteligência artificial e o aprendizado de máquina continuaram a evoluir rapidamente em 2021, permitindo que as empresas automatizassem tarefas complexas e tomassem decisões mais precisas com base em dados.
Esses são apenas alguns exemplos dos avanços tecnológicos que tiveram um impacto positivo nos negócios em 2021. É provável que outros avanços importantes também ocorram no futuro, continuando a moldar o panorama empresarial e a maneira como as empresas operam.
HartB – Estamos chegando ao fim do ano de 2022. Com base no conhecimento adquirido durante o seu treinamento, você é capaz de estimar algumas tendências tecnológicas que podem otimizar o desempenho de operações de negócios a partir do próximo ano?
ChatGPT – É difícil prever com precisão quais serão as principais tendências tecnológicas que otimizarão o desempenho de operações de negócios no próximo ano, pois o panorama tecnológico está em constante mudança e há muitas incertezas e variáveis envolvidas. No entanto, aqui estão algumas tendências tecnológicas que podem ter um impacto positivo nas operações de negócios no futuro próximo:
Inteligência artificial e aprendizado de máquina: A inteligência artificial e o aprendizado de máquina continuarão a ser importantes para as empresas, permitindo automatizar tarefas complexas e tomar decisões mais precisas com base em dados.
Essas são apenas algumas das tendências tecnológicas que podem ter um impacto positivo nas operações de negócios no futuro próximo. É importante lembrar que as tendências tecnológicas são dinâmicas e podem mudar rapidamente, então é importante ficar atento aos desenvolvimentos e avaliar regularmente como as tecnologias podem beneficiar o seu negócio.
HartB – A Inteligência Artificial Geral ainda é algo muito distante da nossa realidade atual, contudo, qual é a sua estimativa em anos para que a humanidade veja a AGI se tornar real?
ChatGPT – A Inteligência Artificial Geral (IAG) é a ideia de criar sistemas de inteligência artificial que são capazes de realizar qualquer tarefa intelectual que um ser humano possa realizar. Enquanto a inteligência artificial tem avançado rapidamente em muitas áreas nos últimos anos, a IAG ainda é considerada um objetivo a longo prazo e não há consenso sobre quando ela poderá ser alcançada.
Alguns especialistas acreditam que a IAG pode ser alcançada em algum momento no futuro, enquanto outros acreditam que ela é provavelmente impossível de se alcançar devido às limitações fundamentais da tecnologia de inteligência artificial atual. No entanto, ainda é cedo demais para dizer com certeza se a IAG será alcançada e, se for, quando isso acontecerá.
HartB – Há sempre muita especulação, sobretudo dos leigos, sobre possíveis ameaças da Inteligência Artificial à humanidade. Neste sentido, você acredita que a IA pode, de fato, nos ameaçar de alguma forma?
ChatGPT – A inteligência artificial (IA) é uma ferramenta poderosa que pode ser usada de muitas maneiras diferentes, tanto para o bem quanto para o mal. Enquanto a IA pode ter muitos benefícios, incluindo a automação de tarefas complexas, a tomada de decisões mais precisas e a melhoria da eficiência, também pode haver preocupações com relação ao seu uso.
Algumas das principais preocupações com relação à IA incluem:
No entanto, é importante lembrar que a IA é apenas uma ferramenta e como tal, depende do uso que lhe é dado pelos seres humanos. As preocupações acima podem ser minimizadas ou evitadas com medidas adequadas de governança e ética ao desenvolver e usar tecnologias de IA.
HartB – Você pode sugerir três aplicações da Inteligência Artificial para fazer do mundo um lugar melhor, no futuro?
ChatGPT – Aqui estão três exemplos de aplicações da inteligência artificial (IA) que poderiam ser usadas para fazer do mundo um lugar melhor no futuro:
Ajuda na identificação de doenças raras: A IA poderia ser usada para analisar grandes quantidades de dados médicos e ajudar a identificar padrões que poderiam indicar a presença de uma doença rara. Isso poderia levar a diagnósticos mais precisos e tratamentos mais eficazes para essas doenças.
Melhoria da segurança alimentar: A IA poderia ser usada para monitorar e gerenciar a produção e o transporte de alimentos, garantindo que eles sejam seguros e saudáveis para consumo. A IA também poderia ser usada para ajudar a identificar e prevenir problemas de segurança alimentar, como contaminação por pesticidas ou doenças transmitidas por alimentos.
Monitoramento do tráfico de espécies ameaçadas: A IA poderia ser usada para monitorar o tráfico ilegal de espécies ameaçadas, como elefantes e rinocerontes, ajudando a proteger esses animais e a preservar seus habitats naturais.
Nota ao leitor: Para que você possa avaliar a qualidade da interação do ChatGPT e tirar suas próprias conclusões, nenhuma das respostas foi submetida a correção ortográfica ou qualquer tipo de edição. Você também pode testar a
plataforma em https://chat.openai.com/.
*Revista HartB é um veículo de comunicação interna HartB.
Deixar um Comentário