Koniec ery czatu w ChatGPT. Co naprawdę potrafi nowy AI agent?

OpenAI zmienia definicję roli sztucznej inteligencji: ChatGPT Agent nie tylko odpowiada – zaczyna działać. To przesunięcie środka ciężkości z myślenia na wykonanie może wywrócić rynek narzędzi AI do góry nogami. Co to konkretnie oznacza dla nas?

Nowe narzędzie, nazwane po prostu ChatGPT Agent, właśnie trafia do użytkowników wersji Plus, Pro i Team w Stanach Zjednoczonych i Wielkiej Brytanii. OpenAI ogłosiło jego start kilka dni temu.

Agent działa jak autonomiczny cyfrowy asystent: korzysta z wbudowanej przeglądarki, terminala, edytora dokumentów i modeli językowych, by realizować złożone zadania – bez potrzeby ciągłej interakcji z użytkownikiem.

Potrafi przeanalizować plik PDF, przygotować na jego podstawie prezentację, zsynchronizować spotkanie i wysłać zaproszenia.

Nie tylko przetwarza dane – wykonuje konkretne czynności w imieniu człowieka.

Jak działa ChatGPT Agent?

Pod maską ChatGPT działa osobna wirtualna maszyna, która dynamicznie uruchamia zestaw narzędzi:

przeglądarkę (wizualną i tekstową),
terminal systemowy,
edytory i analizatory dokumentów.

System dobiera je dynamicznie, w zależności od charakteru zadania i kolejnych kroków procesu.

W praktyce oznacza to, że Agent potrafi:

przeszukiwać internet, wypełniać formularze, nawigować po stronach
pobierać i analizować pliki Word, Excel, PDF
tworzyć prezentacje PowerPoint lub Google Slides
planować spotkania, synchronizować z kalendarzem i przygotowywać agendy
łączyć powyższe kroki w jeden zautomatyzowany ciąg operacji – np. wyszukać lokal, porównać oferty, zarezerwować termin, potwierdzić rezerwację i wygenerować brief

To już nie czat, który „pomaga” – to interfejs działania, który sam wybiera ścieżkę realizacji, i który może być zalążkiem nowego systemu operacyjnego. Gwoli precyzji, prawdziwe systemy operacyjne jak Windows czy iOS to platformy operujące sprzętem i aplikacjami. Agent OpenAI działa wewnątrz platformy ChatGPT, jako aplikacja, a nie system bazowy.

Gdzie działa i co go ogranicza?

Agent dostępny jest na razie wyłącznie w USA i Wielkiej Brytanii. Użytkownicy z Europy – w tym Polski – muszą poczekać.

OpenAI tłumaczy to stopniowym wdrażaniem, ale wiele wskazuje, że realnym powodem są regulacje unijne dotyczące danych i automatyzacji decyzyjnej (AI Act, GDPR).

Obecna wersja ma też wyraźne ograniczenia:

brak możliwości pełnego logowania się do serwisów zewnętrznych i dokonywania transakcji
brak pamięci długoterminowej – agent nie zapamiętuje użytkownika
każda operacja wrażliwa wymaga zatwierdzenia
miesięczne limity użycia: 400 operacji dla Pro, 40 dla Plus i Team (z możliwością zakupu dodatkowych pakietów).

Bezpieczeństwo i ryzyka

OpenAI twierdzi, że bezpieczeństwo było priorytetem tych zmian. Agent działa w trybie „watch mode” – każda istotna decyzja (np. wysyłanie e-maili, edycja danych, logowanie) wymaga zatwierdzenia przez użytkownika.

Dodatkowo zastosowano „klasyfikator” w czasie rzeczywistym, który wykrywa potencjalnie szkodliwe polecenia.

Funkcja pamięci jest wyłączona, by uniknąć ryzyka przechowywania wrażliwych danych. Agent nie może też wykonywać operacji związanych z biotechnologią, bronią chemiczną czy handlem finansowym – te kategorie są całkowicie zablokowane, wg OpenAI.

Mimo to eksperci ostrzegają: agent może zostać zmanipulowany – np. poprzez ukryte instrukcje na stronach internetowych (prompt injection) lub próbę obejścia zabezpieczeń.

Sam Altman, prezes OpenAI, przyznał w rozmowie z The Economist, że to narzędzie jest „technologią przełomową, ale eksperymentalną o ogromnym potencjale i równie dużym ryzyku”.

Co to oznacza dla rynku i użytkowników?

Musimy być świadomi, że nie chodzi tu tylko o kolejną aktualizację. To radykalna zmiana paradygmatu. ChatGPT Agent wyprowadza sztuczną inteligencję poza tekst do realnych działań w internecie.

Przestaje być partnerem w rozmowie, a staje się wykonawcą. W przyszłości może nawet menedżerem.

Dla użytkownika to koniec ery „kopiuj–wklej”: AI łączy analizę, decyzję i wykonanie.

Dla firm – możliwość budowy w pełni autonomicznych mikroprocesów: od rezerwacji sali po wysyłkę zaproszeń i prezentacji.

Dla rynku i biznesu – ogromna presja. Google też rozwija własnych agentów, Microsoft rozbudowuje Copilota, który po obiecującym starcie zupełnie odpadł z rywalizacji z dużymi modelami językowymi. Start-upy typu Rabbit (pamiętacie to niewielkie urządzenie, które z wyglądu przypomina nieco Tamagotchi), czy Perplexity, obiekt pożądania Apple, gorączkowo szukają nisz w architekturze działania. Wszyscy wiedzą, że to jest wyścig o gigantyczne pieniądze.

Zarządzanie agentem to też nowa forma interfejsu: nie przez klik, lecz przez intencję – opisaną w naturalnym języku.

Jak pisze MIT Technology Review: „To nie AI, która coś mówi. To AI, która coś robi.”

Wnioski: To na razie obietnica, więc podejdźmy to tego bez euforii

Agent AI to obietnica świata, w którym codzienne zadania wykonują się same. Ale to również świat, w którym człowiek coraz częściej nie wie, jak dokładnie coś zostało zrobione, ani kto faktycznie podjął decyzję. I nie chodzi tu tylko o software działający gdzieś w tle.

W styczniu 2024 r. widzieliśmy premierę Rabbit R1 – niewielkiego, kieszonkowego urządzenia, które miało pełnić rolę osobistego fizycznego agenta AI. Projekt wzbudził zainteresowanie wyglądem i ideą, ale rzeczywistość szybko ostudziła entuzjazm: urządzenie okazało się niedopracowane technicznie, pozbawione kluczowych funkcjonalności i podatne na ataki. Użytkownicy porzucali je rozczarowani, a specjaliści mówili wprost o produkcie „niedokończonym i przecenionym”. Dziś R1 jest raczej ostrzeżeniem niż wzorem – pokazuje, jak trudne jest przeniesienie agentów AI z ekranu do realnego świata.

Miejmy nadzieję, że agent od OpenAI okaże się dojrzalszy, bardziej użyteczny, i że nie tylko wyznaczy nowy kierunek dla rynku, ale też sprosta oczekiwaniom użytkowników, zanim zachłyśnięcie zamieni się w rozczarowanie.

AI Agent