|
Opus 4.8 przestaje kłamać, a Google rusza po rynek osobistych asystentów AI
|
|
Czerwiec 2026 - Twoje comiesięczne podsumowanie ze świata AI
|
|
Cześć Robert,
Maj mimo zbliżających się wakacji utrzymał tempo. Brytyjski rząd ostrzega, że możliwości AI podwajają się już co 4 miesiące.
Anthropic wypuścił Opusa 4.8, pierwszy model, który realnie przestaje kłamać. Google rzuciło wyzwanie OpenClaw i Hermesowi własnym asystentem. A w tle ponad połowa firm w USA płaci już za sztuczną inteligencję. Zaczynamy.
|
5 rzeczy, które musisz wiedzieć
|
1AI przyśpieszyło. Znowu
Brytyjska agencja badająca AI wyliczyła, że Claude Mythos skrócił czas podwajania możliwości modeli z 7-8 do zaledwie 4 miesięcy. Benchmark METR, który mierzy, jak długie zadania AI wykonuje samodzielnie, potwierdza - Mythos Preview przebił dotychczasowy trend i przy 80% skuteczności wykonuje zadania zajmujące ludzkiemu ekspertowi ponad 3 godziny. Jeśli to tempo się utrzyma, w 3 lata czeka nas 9 podwojeń możliwości AI.
Zobacz więcej >
|
|
2Firefox naprawił w miesiąc więcej błędów niż przez 15 miesięcy
W kwietniu Mozilla z pomocą Claude Mythosa naprawiła 423 błędy. To więcej niż przez poprzednie 15 miesięcy razem wziętych. Sam Mythos znalazł 271 ukrytych podatności, których przez lata nie wychwyciły żadne procesy, w przeglądarce używanej co miesiąc przez 155 milionów osób. Dla mnie najważniejsze jest to, że AI nie zastąpiła specjalistów, tylko umożliwiła im pracę nad zadaniami, do których wcześniej brakowało im czasu i kompetencji.
Zobacz więcej >
|
|
3Opus 4.8 - pierwszy model, który (ponoć) nie kłamie
Anthropic wypuścił Opusa 4.8 i w mojej ocenie to najlepszy model do codziennej pracy. Nawet nie przez jego bezpośrednią inteligencję, tylko przez postęp tam, gdzie AI ma dziś największy problem: niezawodność i uczciwość. W teście na ukrywanie wad kodu poprzedni Opus milczał w 19,7% przypadków, Sonnet 4.6 aż w 65,2%, a Opus 4.8 zszedł do 3,7%. W teście na lenistwo pierwszy raz model nie pomylił się ani razu. Do tego świetnie radzi sobie z długim kontekstem i dominuje większość benchmarków biznesowych.
Zobacz więcej >
|
|
4Gemini Spark - odpowiedź Google na OpenClaw i Hermes
Google zapowiedziało Gemini Spark, osobistego agenta AI działającego 24/7 w chmurze. Jego przewaga jest oczywista: kontekst i ekosystem. Spark ma dostęp do Twojego Gmaila, Drive, Kalendarza i całego Workspace. Bez manualnej konfiguracji: stawiania serwera, podpinania go pod aplikacje, budowania i pobierania skilli. Po prostu otwierasz aplikację i piszesz: przygotuj podsumowanie dnia, znajdź zaległe zadania w dokumentach, daj znać, gdy konkurent wypuści nowy produkt. Pierwsza wersja ma działać z Gemini 3.5 Flash, więc nie liczę na cuda - prawdziwy test przyjdzie wraz z premierą Gemini 3.5 Pro w przyszłym miesiącu.
Zobacz więcej >
|
|
5Ponad 50% firm w USA płaci już za AI
Ramp AI Index pokazuje, że ponad połowa amerykańskich firm aktywnie płaci za narzędzia AI. To nie deklaracje z ankiet, tylko dane wyciągane prosto z faktur. Dla tych, którzy przez 3 lata powtarzali, że AI to bańka, to bardzo niewygodna liczba - kiedy 50% firm z największej gospodarki świata płaci za technologię w 3 lata od premiery, mówimy o sytuacji absolutnie bezprecedensowej. W wielu firmach to wciąż chaos: kilka subskrypcji i pierwsze automatyzacje. Ale dokładnie tak wyglądała adopcja komputerów i internetu.
Zobacz więcej >
|
|
|
|
|
Tip miesiąca
Nie daj się naciągnąć dostawcom AI
Niewiele osób wie, że dostawcy AI potrafią po cichu obniżać jakość swoich modeli. MarginLab od 22 maja widzi spadek skuteczności Claude Code z Opusem 4.7 - z bazowych 65% do 50%, i jest to spadek statystycznie istotny. Ty płacisz tyle samo, oni wydają mniej na serwowanie modelu, a różnica zostaje w ich kieszeni. OpenAI łapano na tym samym.
Dlatego zbuduj własny benchmark - nie abstrakcyjne testy, tylko zestaw zadań z Twoich codziennych procesów. Pozwoli Ci wybrać model z najlepszym stosunkiem jakości do kosztu oraz wychwycić moment, w którym dostawca po cichu obniża jakość modelu. Taka wiedza potrafi być warta dziesiątki, a czasem setki tysięcy złotych.
Zobacz więcej >
|
|
|
|
Polecane narzędzia i modele AI - czerwiec 2026
|
|
Automatyzacja
|
|
Codex z GPT 5.5
Agent OpenAI, który steruje Twoim komputerem, wykonuje zadania w przeglądarce, obsługuje arkusze, slajdy i PDF-y. Świetnie działa głosowo po polsku. Zobacz więcej >
|
|
|
|
Kod i strony
|
|
Claude Code z Opusem 4.8
Agent programujący, który samodzielnie planuje, pisze i testuje kod. Opisujesz po polsku, czego potrzebujesz - Claude buduje stronę, narzędzie wewnętrzne czy automatyzację za Ciebie.
Poradnik >
|
|
|
|
Agenci
|
|
OpenClaw
Autonomiczny agent AI w Twoim komunikatorze (WhatsApp, Telegram, Slack). Zlecasz mu zadania jak współpracownikowi - sam planuje, wykonuje i raportuje. Działa lokalnie na Twoim serwerze.
|
|
|
|
Baza wiedzy
|
|
NotebookLM
Wrzucasz dokumenty, filmy z YouTube, strony - Google tworzy z nich przeszukiwalną bazę wiedzy z podcastami audio i podsumowaniami. Idealne do nauki i onboardingu nowych pracowników.
|
|
|
|
Wyszukiwanie
|
|
Grok 4.3
Nowy model od xAI z wbudowanym wyszukiwaniem, dostępem do danych z X i rekordowo niskim poziomem halucynacji. Bezpłatny w aplikacji Grok - idealny do researchu i analiz wymagających aktualnych informacji - również tych wymykających się konsensusowi.
|
|
|
|
Produktywność
|
|
Whispr Flow
Dyktowanie w dowolnym programie na komputerze, w iOS i Androidzie - polski z 97% dokładnością. Mówisz, tekst pojawia się w mailu, dokumencie czy CRM.
|
|
|
|
Grafika
|
|
GPT Image - 2
Pierwszy prawdziwie myślący model AI do grafiki. Generuje i edytuje zdjęcia produktowe, reklamy i infografiki na poziomie, który wcześniej był niedostępny dla sztucznej inteligencji. Zobacz przykłady >
|
|
|
|
Produktywność
|
|
Fyxer AI
Automatyczne notatki ze spotkań i gotowe drafty maili na ich podstawie. Twój asystent, który działa cały czas w tle.
|
|
|
|
|
Polecane poradniki
|
Jak zarobić na rewolucji AI? 3 konkretne sposoby
Możliwości AI przyspieszają, a większość gospodarki nie jest na to gotowa. Ten artykuł nie straszy - pokazuje, jak na tym zamieszaniu zarobić. Trzy konkretne ścieżki: inwestycje w aktywa stojące za infrastrukturą AI, bycie niezastąpionym ekspertem w swojej branży i niedoceniane zawody fizyczne.
Czytaj dalej >
|
|
Shadow AI - pracownicy używają AI bez Twojej wiedzy
69% pracowników w Polsce korzysta z AI bez wiedzy działu IT, a 72% wkleiło firmowe treści do ChatGPT lub Gemini bez oceny ryzyka. Skąd bierze się to zagrożenie (RODO, trenowanie modeli na Twoich danych) i jak wdrożyć bezpieczną politykę AI w firmie.
Czytaj poradnik >
|
|
Claude Code - kompletny poradnik tworzenia stron i aplikacji
Jak bez doświadczenia technicznego budować strony i aplikacje, opisując po polsku, czego potrzebujesz. Instalacja, konfiguracja środowiska, budowanie projektów i współpraca z zespołem technicznym, krok po kroku.
Czytaj poradnik >
|
|
|
|
Chcesz wdrożyć AI w swojej firmie?
|
|
Umów się na bezpłatną konsultację. Porozmawiamy o tym, jak AI może pomóc Twojemu zespołowi - bez zobowiązań.
|
|
|
|
PS: Jeśli masz pytania o AI albo chcesz, żebyśmy omówili konkretny temat - po prostu odpisz na tego maila.
|
|
|
|
Znasz kogoś, kto powinien to przeczytać?
Prześlij ten newsletter znajomemu, który chce być na bieżąco z AI
Prześlij znajomemu
|
|
|
|
|
| |