Paweł, Twoje AI nie jest za głupie. Jest zbyt samotne... a przecież idą wakacje!

Cześć Paweł!

W zeszłym tygodniu zbudowałem sobie agenta AI, który zaplanował mi rodzinne wakacje nad Bałtykiem. Brzmi jak fanaberia - i właśnie dlatego o tym piszę.

Bo gdy go puściłem, zrobił cztery rzeczy, których u mnie nie potrafiło wcześniej żadne AI. A potem mnie olśniło: to dokładnie te cztery rzeczy, na które narzekaliście Wy - w odpowiedziach na moje dwa ostatnie maile.

Idą wakacje. Ale ten mail nie jest o urlopie. Jest o jednym: co z Twojej roboty robi się samo, kiedy Cię nie ma - a co po prostu staje.

W tym wydaniu

Co u mnie - duże wdrożenie w ubezpieczeniach, rozbudowa VIP-a i wtorkowe warsztaty
Rozbiór: 4 rzeczy, które AI "psuje" - Wasze odpowiedzi, jedna wspólna przyczyna i recepta na każdą
Quick Win - 3 pliki, które robią Twoje AI mądrzejszym w 15 minut
Newsy - Anthropic pisze agentem 65% własnego kodu (i co to znaczy dla Ciebie)
Hot take - dlaczego Twoje AI nie jest za głupie

Co u mnie

Duży projekt w ubezpieczeniach. Ruszamy spore wdrożenie B2B - zespół agentów AI dla firmy z branży ubezpieczeniowej. Szczegóły jak dowieziemy, ale cieszy mnie sam kierunek: agenci wychodzą z "fajnego dema" do roboty, za którą firmy realnie płacą.

Masterclass VIP - mocno rozbudowuję materiały. Siedzę teraz nad warsztatami i dosypuję konkretów: więcej gotowych wzorców, więcej "na żywo zbuduj ze mną", mniej teorii. Chcę, żeby po każdym warsztacie zostawał Ci działający kawałek systemu, nie notatki.

We wtorek warsztaty publiczne - agenci AI i brain. 30 czerwca, 19:00, otwarte i bezpłatne. Pokażę na żywo, jak budować armię agentów i swój drugi mózg - czyli dokładnie mechanikę z tego maila. Zapisać się można tu.

I idą wakacje. U mnie to nie sygnał "zwalniamy", tylko "weryfikujemy". Przeglądam procesy i pytam o każdy z osobna: zadziała, gdy mnie nie będzie? Co trzyma się wyłącznie na mnie? Bo urlop to najszczerszy audyt, jaki firma robi sama sobie - i o tym właśnie jest dziś główny temat.

Rozbiór: 4 rzeczy, które AI "psuje"

W PS-ach z ostatnich tygodni zadałem Wam dwa pytania: czego uczysz AI w kółko i co AI częściej psuje, niż przyspiesza. Obiecałem, że rozbiorę odpowiedzi - masz to niżej.

I tu niespodzianka. Posortowałem je, spodziewając się dwudziestu różnych problemów. A wyszło jedno zdanie:

AI nie psuje Twojej roboty. Obnaża, ile z niej stało na Tobie.

Każda skarga brzmiała jak wada modelu. A po rozłożeniu okazała się czymś innym: rzeczą, którą trzymałeś we własnej głowie i nigdy nie oddałeś maszynie. Dopóki to wszystko trzyma się na Tobie, nic nie ruszy bez Ciebie. A za trzy dni - wakacje. Czyli dokładnie ten moment.

Najlepiej pokazać to na moim agencie do wakacji. Bo on nie psuł żadnej z tych czterech rzeczy - i widać po nim, dlaczego.

1. "Zmyśla. Brzmi pewnie, a podaje bzdurę."

Ktoś z Was napisał wprost: przy fakturze błąd jednej cyfry to już problem podatkowy. Słusznie.

Ale model nie zmyśla ze złości - zmyśla, bo nie dałeś mu jak sprawdzić. Czat brzmi pewnie. Agent jest pewny, bo ma narzędzia: pyta mapę o trasę, bazę o godziny, oficjalną stronę o cenę. Mój agent wyłapał, że bilet do grodu kosztuje realnie 27 zł, a nie 14 zł, jak podawały starsze wpisy. Klif Gosań to sprawdzone 93,4 m, nie "chyba wysoko".

Recepta: nie każ AI być mądrzejszym. Daj mu prawo i narzędzie, żeby zweryfikował.

2. "Nie pamięta. Tłumaczę mu to samo w kółko."

Najczęstsza skarga. I najprostsza przyczyna: kontekst siedzi w Twojej głowie, nie w systemie. Co sesję wklejasz od nowa, kim jesteś i co robisz.

Mój agent wiedział, że moja córka jest fanką mangi - i sam znalazł konwent w naszych datach. Nie napisałem tego w poleceniu. To siedzi w moim drugim mózgu, nie we wklejce.

Recepta: zapisz kontekst raz, w systemie. Wtedy każdy agent korzysta z niego za darmo.

3. "Robi średnią papkę. Nie to, o co prosiłem."

Bo dałeś jeden wielki cel jednemu modelowi naraz - a on musi żonglować dziesięcioma rzeczami w jednej głowie. Wychodzi uśrednione "Szczecin ma fajną starówkę".

Mój agent rozbił robotę na sześciu wyspecjalizowanych pomocników, którzy ruszyli równolegle: jeden okopał się w Szczecinie, drugi w Wolinie, trzeci polował na wydarzenia, czwarty liczył trasę. Każdy kopał głęboko, bo nie rozpraszał się na resztę.

Recepta: dekompozycja. Mały zespół specjalistów bije jednego przemęczonego omnibusa.

4. "Wyrywa stery. Robi za dużo na własną rękę."

Odwrotny problem, ta sama przyczyna - brak punktu, w którym maszyna ma się zatrzymać i zapytać.

Mój agent znalazł powód, żeby odwrócić całą trasę (konwent mangi dla córki). I nie przewrócił planu sam. Położył wariant na stole z konsekwencjami - "zyskujecie noc nad morzem i krótszą drogę" - a wielką decyzję zostawił nam, przy stole. To się nazywa człowiek w pętli: tempomat prowadzi, ręce zostają na kierownicy.

Recepta: ustaw HITL na krytycznych krokach. AI proponuje, Ty zatwierdzasz.

Zauważ, co tu się stało. Żadna z tych czterech rzeczy nie była wadą AI. Każda była brakiem w systemie wokół AI: brakiem narzędzi, pamięci, podziału pracy albo bezpiecznika. To dobra wiadomość - bo braków się nie przeczeka. Braki się uzupełnia.

Cały rozbiór na agencie do wakacji opisałem krok po kroku tutaj:

Zbudowałem agenta AI, który planuje mi wakacje

Quick Win tygodnia

Daj swojemu AI pamięć i ręce - w 15 minut.

Weź to, co tłumaczysz AI w kółko, i zapisz raz do trzech zwykłych plików:

profil.md - kim jesteś, jak pracujesz, czego nie znosisz
firma.md - co robisz, dla kogo, jak brzmisz
cele.md - co jest ważne teraz

Od teraz wrzucasz je na start rozmowy zamiast tłumaczyć od zera. To pierwszy kamień Twojego drugiego mózgu (recepta nr 2).

A jak chcesz wskoczyć poziom wyżej - daj mu ręce: podłącz narzędzia, z których korzystasz, przez MCP albo API (kalendarz, mail, baza, mapy). Wtedy AI przestaje zgadywać, a zaczyna sprawdzać u źródła (recepta nr 1).

Czas: ~15 min

Efekt: koniec z tłumaczeniem w kółko + AI, które weryfikuje, zamiast wymyślać

Newsy z rynku

Anthropic wpuszcza agenta na stałe do Slacka - i pisze nim 65% własnego kodu

Nowość nazywa się Claude Tag: oznaczasz @Claude w kanale jak kolegę z zespołu i delegujesz mu wieloetapowe zadania, a on robi je w tle, pamięta kontekst projektu i sam pilnuje wątków. Sama Anthropic mówi, że 65% kodu ich zespołu produktowego powstaje już tak.

Moje zdanie: to żywy dowód dzisiejszego tematu. Różnica między nimi a Tobą to nie model - oni mają ten sam Opus, co Ty. Różnica jest w tym, że dali agentowi proces, pamięć i miejsce, gdzie i tak pracują. Dokładnie cztery recepty z góry, tyle że na skalę firmy.

Źródła: Anthropic | The Decoder

Jednym zdaniem: Gartner prognozuje 206,5 mld USD wydatków na oprogramowanie agentowe w 2026 (+139% rok do roku). Rynek mówi to samo, co ja - tylko liczbami.

To skrót. Pełna prasówka z tego tygodnia (23 newsy + komentarze + źródła):

stormit.pl/radar

Bez rejestracji.

Hot take

Twoje AI nie jest za głupie. Jest zbyt samotne.

Nie dałeś mu ani pamięci, ani kolegów, ani prawa, żeby cokolwiek sprawdziło. Posadziłeś geniusza w pustym pokoju bez telefonu i internetu, a potem dziwisz się, że zgaduje.

Nie naprawisz tego czekaniem na mądrzejszy model. Naprawisz to lepszym systemem wokół - dokładnie tym, co większość nazywa "za trudne", a co da się zacząć od trzech plików .md.

Która z tych czterech rzeczy najbardziej boli u Ciebie? Odpisz mi numerem - ale jeśli masz chwilę, dorzuć jedno zdanie: co konkretnie próbujesz oddać AI i co się przy tym sypie? Czytam każdą odpowiedź sam, a najciekawsze przypadki rozbieram w kolejnych mailach - Twój może być następny.

Wtorek 30.06, 19:00 - bezpłatne warsztaty o Claude Code: armia agentów i drugi mózg

Te cztery recepty pokażę na żywo, budując agenta od zera - z pamięcią, narzędziami i podziałem pracy. To samo, co robi mój agent od wakacji, tylko pod Twoją robotę. Trzy dni od teraz.

Zapisuję się na warsztaty

Do następnej soboty!

Tomek

PS. Dzięki wszystkim, którzy odpisali na moje dwa ostatnie pytania - ten rozbiór powstał z Waszych odpowiedzi. To jest dokładnie ten mechanizm: piszecie, ja zbieram, i robi się z tego coś wartościowego dla każdego, kto to czyta. Działa w obie strony.