Sztuczna inteligencja z każdym dniem jest coraz bardziej zaawansowana. Już teraz specjalistyczne warianty posiadają możliwości rozumowania na niespotykaną skalę.
DeepSeek, czyli chińska firma która wzbudziła zainteresowanie na początku roku swoim chatbotem, właśnie zaprezentowała nowy model DeepSeekMath-V2. Według twórców, ma on osiągnąć kilka specjalistycznych celów. Przede wszystkim, poradzi on sobie z samoweryfikowalnym rozumowaniem matematycznym oraz rygorystycznym procesem wyprowadzania dowodów. To ostatnie ma kłaść szczególny nacisk na dowodzenie twierdzeń, a nie jedynie otrzymanie poprawnych odpowiedzi końcowych.
Nowy model dorównuje wynikami złotym medalistom

Firma poinformowała, że nowy model wykorzystuje pętlę generowania i weryfikacji. Zastosowano w niej dokładny weryfikator oparty na LLM, wytrenowany specjalnie do dowodzenia twierdzeń matematycznych. Pokazał on już swoje możliwości w ostatnich konkursach matematycznych. Model uzyskał rezultaty na poziomie złotego medalu w ramach IMO 2025 i CMO 2024, a także niemal perfekcyjny wynik 118/120 w Putnam 2024 przy użyciu skalowanej mocy obliczeniowej w czasie testu.
Projekt zbudowany został na bazie DeepSeek-V3.2-Exp-Base i jest dostępny za darmo na platformie HuggingFace. Premiera tego modelu może oznaczać prawdziwą rewolucję w dziedzinie matematyki, pozwalając na nowe odkrycia naukowe usprawniające różne dziedziny życia. Oczywiście, firmy jak OpenAI czy DeepSeek nadal szukać będą nowych metod zwiększania matematycznego zrozumienia swoich modeli sztucznej inteligencji.

Najnowsze Komentarze