Introdução à IA — Módulo 0

1 O que é Inteligência Artificial?

A pergunta que todo mundo faz — e que tem várias respostas.

💡 Analogia inicial

🎓IA é como ensinar um computador a tomar decisões — seja seguindo regras que nós escrevemos, seja aprendendo com exemplos que nós fornecemos.

Não existe uma definição única de IA. Alguns dizem que é "fazer máquinas pensarem como humanos". Outros dizem que é "fazer máquinas resolverem problemas". A verdade é que IA é um guarda-chuva que cobre várias técnicas — e vamos explorar cada uma delas neste curso.

Uma definição prática

Para fins deste curso, vamos usar uma definição pragmática:

🎯 IA = qualquer sistema que executa tarefas que normalmente exigiriam inteligência humana — como reconhecer padrões, entender linguagem, tomar decisões ou aprender com dados.

O que IA não é

🤖

Não é consciência

IA não "sabe" que existe. Não tem sentimentos, desejos ou experiência subjetiva.

🧙

Não é mágica

Toda IA é matemática e estatística. Não há "espírito" no código — apenas algoritmos.

🔮

Não é infalível

IA erra, alucina, tem viés. É uma ferramenta poderosa, mas imperfeita.

👁️

Não é "olhos que veem"

Um sistema de visão computacional não "vê" como você — ele processa matrizes de pixels.

2 Uma breve história da IA

De Turing aos LLMs — 75 anos de altos e baixos.

💡 Analogia

🎢A história da IA é como uma montanha-russa: períodos de entusiasmo explosivo seguidos de "invernos" onde o financiamento seca. Estamos em um dos picos mais altos desde 1956.

🎮 Timeline interativa

Clique em cada marco para ver mais detalhes. Os marcos em destaque são os mais importantes para o curso.

1950
🧪 Teste de Turing
Alan Turing publica "Computing Machinery and Intelligence" e propõe: "uma máquina pode pensar?". Cria o famoso teste de imitação.
🌱 Nascimento da ideia

1956
🎓 Conferência de Dartmouth
John McCarthy cunha o termo "Inteligência Artificial". Nasce oficialmente o campo como disciplina científica.
🌱 Fundação

1966

💬 ELIZA

Joseph Weizenbaum cria ELIZA, o primeiro chatbot. Simula um psicoterapeuta usando padrões simples de linguagem.

🌱 Primeiros chatbots

1970-80

❄️ Primeiro "inverno da IA"

Expectativas altas, resultados limitados. Financiamento seca. Sistemas especialistas dominam, mas são frágeis.

❄️ Inverno

1997

♟️ Deep Blue vence Kasparov

Computador da IBM derrota o campeão mundial de xadrez. Marco simbólico: IA supera humanos em jogos estratégicos.

📈 Ascensão

2011

🏆 Watson vence no Jeopardy!

IBM Watson derrota campeões humanos em programa de TV, entendendo linguagem natural e piadas.

📈 Ascensão

2012
🔥 AlexNet — a revolução do Deep Learning
Rede neural profunda destrói competição de reconhecimento de imagens (ImageNet). Começa a era moderna do DL.
🔥 Revolução DL

2016

🎯 AlphaGo vence Lee Sedol

DeepMind cria IA que derrota campeão mundial de Go — jogo considerado muito complexo para máquinas. Usa deep learning + reinforcement learning.

🔥 Revolução DL

2017
⚡ "Attention is All You Need"
Google publica o paper dos Transformers. Arquitetura que mudaria tudo: base de GPT, BERT, Claude, Llama. É o alicerce dos LLMs modernos.
⚡ Era dos Transformers

2020

🚀 GPT-3

OpenAI lança modelo com 175 bilhões de parâmetros. Capacidades impressionantes de geração de texto. Começa a era dos LLMs comerciais.

⚡ Era dos LLMs

2022
💥 ChatGPT — IA para todos
OpenAI lança ChatGPT. 100 milhões de usuários em 2 meses. IA deixa de ser coisa de laboratório e vira ferramenta do dia a dia.
🌍 IA mainstream

2023

🏗️ GPT-4, Claude, Llama 2

Modelos multimodais (imagem + texto). Open-source ganha força com Llama. RAG vira padrão para empresas.

🌍 IA mainstream

2024

🎨 GPT-4o, Claude 3, Llama 3

Modelos mais rápidos, baratos e capazes. Agentes de IA começam a aparecer. Modelos locais rodam em laptops.

🌍 IA mainstream

2025-26
🤖 Agents, RAG em produção, IA local
Sistemas de IA agem no mundo real. RAG vira padrão corporativo. Modelos como Llama 3.1, Qwen 2.5, Mistral rodam localmente. É onde estamos agora.
🎯 Hoje

💡 Padrão histórico: note como a IA avança em ondas. Cada "invernor" é seguido por um avanço técnico que reacende o entusiasmo. A pergunta é: estamos no pico de mais uma bolha, ou dessa vez é diferente?

3 IA Fraca vs IA Forte (AGI)

Onde estamos hoje — e para onde (talvez) vamos.

💡 Analogia

🎭IA Fraca é como um ator que decora um papel — brilha em uma tarefa específica. IA Forte (AGI) seria um ator que entende a vida — capaz de interpretar qualquer papel em qualquer contexto.

🎯 IA Fraca (Narrow AI / ANI)

O que é: IA especializada em UMA tarefa.

Exemplos: Siri, recomendações da Netflix, ChatGPT, AlphaGo, carros autônomos.

Limitação: excelente no que faz, inútil fora disso.

✅ Onde estamos hoje. Tudo que você usa é IA fraca.

🌌 IA Forte (AGI)

O que é: IA com capacidade cognitiva geral, comparável à humana.

Exemplos: ainda não existe (talvez C-3PO, Data de Star Trek).

Características: aprender qualquer tarefa, raciocinar, transferir conhecimento.

🔮 Objetivo de longo prazo. Ninguém sabe quando (ou se) será alcançado.

Teste rápido: é IA fraca ou forte?

Cenário: Um sistema que joga xadrez melhor que qualquer humano, mas não sabe amarrar cadarço, escrever um e-mail ou reconhecer um gato.

IA Fraca (ANI)

IA Forte (AGI)

⚠️ Cuidado com o hype: quando alguém disser "a IA vai dominar o mundo", lembre-se: toda IA atual é fraca. LLMs impressionam, mas não entendem nada — apenas fazem previsão estatística de tokens. AGI é ficção científica por enquanto.

4 Os 3 paradigmas da IA

Três formas radicalmente diferentes de fazer máquinas "pensarem".

💡 Analogia geral

🍽️Imagine que você quer ensinar alguém a cozinhar. Há 3 abordagens: (1) dar uma receita passo a passo, (2) mostrar 1000 pratos e deixar a pessoa descobrir padrões, (3) conectar neurônios até a pessoa "sentir" o que funciona.

Esses 3 caminhos representam os 3 paradigmas da IA. Cada um domina uma época histórica — e todos coexistem hoje, cada um com seus pontos fortes.

🎮 Simulador de paradigmas

Cada paradigma resolve o mesmo problema (detectar spam) de um jeito diferente. Clique nas abas para ver.

📜 Paradigma Simbólico (1950-1990)

Também chamado de "IA Good Old-Fashioned" (GOFAI). A ideia: escrever regras explícitas que o computador segue. É como programar um especialista humano.

Sistema especialista para detectar spam:

SE assunto contém "GRÁTIS" E "GANHE" → SPAM

SE remetente não está em contatos → SUSPEITO

SE contém link suspeito E "clique aqui" → SPAM

SE idioma diferente do usuário → SUSPEITO

SENÃO → LIMPO

✅ Vantagens

• Transparente (você entende cada regra)

• Previsível

• Não precisa de dados

❌ Desvantagens

• Frágil (regra nova = bug novo)

• Não generaliza

• Escrita manual é insustentável

Exemplos reais: MYCIN (diagnóstico médico, 1970), DENDRAL (química, 1965), chatbots antigos baseados em padrões.

📊 Paradigma Estatístico (1990-2010)

Em vez de regras, aprender com dados. O computador analisa milhares de exemplos e descobre padrões estatísticos. Nasce o Machine Learning clássico.

Filtro de spam estatístico (Naive Bayes):

Treinamento: 10.000 e-mails etiquetados (spam/limpo)

Modelo aprende: "GRÁTIS" aparece 87% em spam, 2% em limpos

Modelo aprende: "reunião" aparece 3% em spam, 78% em limpos

Novo e-mail → calcula probabilidade combinada → classifica

✅ Vantagens

• Generaliza (aprende padrões)

• Robusto a ruído

• Escala com dados

❌ Desvantagens

• Precisa de MUITOS dados etiquetados

• Engenharia de features manual

• Limitado a tarefas bem definidas

Exemplos reais: Spam filters, PageRank do Google, sistemas de recomendação, SVMs, Random Forests.

🧠 Paradigma Conexionista (2012-hoje)

Inspirado no cérebro: redes de neurônios artificiais que aprendem sozinhas os padrões. Não precisa de regras nem de features manuais — a rede descobre tudo. Nasce o Deep Learning e, eventualmente, os LLMs.

Classificador de spam com rede neural:

Input: texto bruto do e-mail (tokens)

Camada 1: detecta padrões locais (palavras-chave)

Camada 2: detecta combinações ("ganhe" + "agora" + "clique")

Camada 3: detecta contexto (tom, estrutura, intenção)

Output: probabilidade de ser spam (0.0 a 1.0)

✅ Vantagens

• Aprende features sozinho

• Funciona com dados brutos (texto, imagem, áudio)

• Escala massivamente com dados e compute

❌ Desvantagens

• "Caixa preta" (difícil interpretar)

• Precisa de MUITOS dados E compute

• Caro para treinar

Exemplos reais: GPT, Claude, Llama, DALL-E, Whisper, AlphaFold, sistemas de visão computacional.

Comparação dos 3 paradigmas

Aspecto	📜 Simbólico	📊 Estatístico	🧠 Conexionista
Época de ouro	1950-1990	1990-2010	2012-hoje
Ideia central	Regras explícitas	Aprender com dados	Redes de neurônios
Dados necessários	Nenhum	Muitos (etiquetados)	Enormes (brutos)
Transparência	Alta	Média	Baixa
Exemplo icônico	MYCIN (médico)	Spam filter	ChatGPT

💡 Hoje: os 3 paradigmas coexistem. Sistemas modernos combinam regras (para casos críticos), ML clássico (para tarefas tabulares) e deep learning (para linguagem e visão). Não é "um substitui o outro" — cada um tem seu lugar.

5 ML vs Deep Learning vs IA Generativa

Três termos que todo mundo confunde — vamos esclarecer.

💡 Analogia

🪆Pense como bonecas russas (matrioshkas): IA Generativa está dentro de Deep Learning, que está dentro de Machine Learning, que está dentro de Inteligência Artificial.

Cada conceito é um subconjunto do anterior. Nem toda IA é ML, nem todo ML é DL, nem todo DL é generativo. Mas toda IA generativa moderna usa DL.

Diagrama de conjuntos

Machine Learning

Aprender com dados

Deep Learning

Redes neurais profundas

IA Generativa

Criar conteúdo novo

Definições claras

📊

Machine Learning (ML)

Sistemas que aprendem padrões a partir de dados, sem serem explicitamente programados para cada tarefa.

Ex: prever preço de casa, classificar e-mail como spam, recomendar produto.

🧠

Deep Learning (DL)

Subconjunto do ML que usa redes neurais com muitas camadas. Aprende representações hierárquicas dos dados.

Ex: reconhecer imagem, traduzir texto, detectar câncer em raio-X.

🎨

IA Generativa (GenAI)

Subconjunto do DL que cria conteúdo novo (texto, imagem, áudio, código) em vez de apenas classificar ou prever.

Ex: ChatGPT, DALL-E, Midjourney, Claude, Llama.

Exemplo unificado: reconhecimento de imagem

📊 ML clássico

Entrada: features extraídas manualmente (cor média, bordas, texturas)

Saída: "gato" ou "cachorro"

Precisa que um humano defina quais features olhar.

🧠 Deep Learning

Entrada: pixels brutos da imagem

Saída: "gato" ou "cachorro"

A rede descobre sozinha quais features importam.

💡 No nosso curso: vamos usar os 3 níveis. ML clássico no Módulo 1 (regressão, clustering), DL no Módulo 2 (redes neurais) e GenAI do Módulo 5 em diante (LLMs, RAG, agents).

6 IA no mundo real hoje

Onde a IA já está — muitas vezes sem você perceber.

🎬

Recomendação

Netflix, Spotify, YouTube, Amazon — todos usam IA para sugerir o que você vai gostar.

🗣️

Assistentes de voz

Siri, Alexa, Google Assistant — reconhecem fala e respondem com IA.

🚗

Carros autônomos

Tesla, Waymo — visão computacional + decisão em tempo real.

💬

Chatbots

Atendimento ao cliente, suporte técnico — cada vez mais com LLMs.

🏥

Saúde

Diagnóstico por imagem, descoberta de drogas, predição de riscos.

💰

Finanças

Detecção de fraude, trading algorítmico, análise de crédito.

🎨

Criação de conteúdo

Texto (ChatGPT), imagem (Midjourney), vídeo (Sora), música (Suno).

🔍

Busca

Google, Bing — IA entende sua intenção, não só keywords.

🎮 Teste: qual IA está por trás?

Para cada cenário, identifique qual paradigma é mais provável.

Cenário 1: Um sistema que sugere filmes na Netflix baseado no que você já assistiu.

📜 Simbólico

📊 Estatístico (ML)

🧠 Conexionista (DL)

Cenário 2: Um chatbot que responde perguntas sobre sua empresa usando documentos internos.

📜 Simbólico

📊 Estatístico (ML)

🧠 Conexionista (LLM + RAG)

🎯 Quiz — teste seu conhecimento

Clique em uma alternativa para ver se acertou.

1. Qual a diferença fundamental entre IA Fraca e IA Forte (AGI)?

IA Fraca é antiga, IA Forte é moderna

IA Fraca é especializada em uma tarefa; IA Forte teria capacidade cognitiva geral

IA Fraca usa regras; IA Forte usa redes neurais

2. O que caracteriza o paradigma simbólico da IA?

Aprender com grandes volumes de dados

Redes neurais profundas

Regras explícitas escritas por humanos

3. Qual evento em 2017 é considerado o alicerce dos LLMs modernos?

Publicação do paper "Attention is All You Need" (Transformers)

Lançamento do GPT-3

AlphaGo vence Lee Sedol

4. ChatGPT é um exemplo de:

IA Forte (AGI)

IA Fraca baseada em Deep Learning / IA Generativa

Sistema especialista simbólico

5. Qual a relação entre Machine Learning, Deep Learning e IA Generativa?

São três nomes para a mesma coisa

São tecnologias concorrentes que se excluem

São subconjuntos: GenAI ⊂ DL ⊂ ML ⊂ IA

6. Qual é a principal vantagem do paradigma estatístico (ML) sobre o simbólico?

Generaliza para casos não vistos, aprendendo padrões dos dados

Não precisa de dados para funcionar

É totalmente transparente e explicável

7. O marco de 2012 (AlexNet) foi importante porque:

Lançou o primeiro chatbot comercial

Demonstrou que redes neurais profundas superavam métodos clássicos em visão computacional

Criou o primeiro sistema especialista médico

8. Qual afirmação sobre IA atual é CORRETA?

Já alcançamos a AGI — máquinas pensam como humanos

IA é apenas moda passageira, sem aplicações reais

Toda IA atual é "fraca" — excelente em tarefas específicas, mas sem compreensão geral

9. Um filtro de spam que analisa estatisticamente a frequência de palavras em e-mails etiquetados é exemplo de:

Paradigma estatístico (ML clássico)

Paradigma simbólico

IA Generativa

10. O que significa dizer que LLMs fazem "previsão estatística de tokens"?

Eles entendem profundamente o significado do texto

Eles calculam probabilidades de qual palavra vem a seguir, baseado em padrões do treinamento

Eles seguem regras gramaticais explícitas

→ O que vem a seguir?

Agora que você entende o que é IA, vamos aprender como ela aprende.

📈

Próximo módulo

Módulo 1 · Machine Learning Clássico

Vamos mergulhar no paradigma estatístico: regressão, classificação, clustering. Como máquinas aprendem com dados — antes das redes neurais.

Conceitos que vamos construir aqui

📏

Regressão

Prever valores contínuos (ex: preço de uma casa).

🏷️

Classificação

Categorizar em classes (ex: spam/não-spam).

🎯

Clustering

Agrupar dados similares sem rótulos prévios.

⚖️

Overfitting

O dilema: memorizar vs generalizar.

💡 Conexão com RAG: os embeddings que usaremos em RAG são vetores — e vetores são a base de todo ML. Quando você entender clustering (K-means), vai entender como os Vector DBs organizam os chunks semanticamente.