AI modeliai pradeda spręsti aukšto lygio matematikos problemas

Savaitgalį Neelas Somani, kuris yra programinės įrangos inžinierius, buvęs kvantų tyrinėtojas ir startuolių įkūrėjas, išbandė naujojo OpenAI modelio matematikos įgūdžius, kai padarė netikėtą atradimą. Įklijavęs problemą į „ChatGPT“ ir leisdamas jai galvoti 15 minučių, jis grįžo prie visiško sprendimo. Jis įvertino įrodymą ir įformino jį įrankiu, pavadintu Harmonic, bet viskas buvo patikrinta.

„Man buvo įdomu nustatyti pradinį tašką, kada LLM gali veiksmingai išspręsti atviras matematikos problemas, palyginti su problemomis“, – sakė Somani. Nustebino tai, kad naudojant naujausią modelį siena šiek tiek pradėjo stumtis į priekį.

„ChatGPT“ minčių grandinė yra dar įspūdingesnė, atmušdama tokias matematines aksiomas kaip Legendre formulė, Bertrano postulatas ir Dovydo žvaigždės teorija. Galiausiai modelis rado 2013 m. Math Overflow įrašą, kuriame Harvardo matematikas Noamas Elkiesas pateikė elegantišką panašios problemos sprendimą. Tačiau galutinis ChatGPT įrodymas labai skyrėsi nuo Elkieso darbo ir pateikė išsamesnį legendinio matematiko Paulo Erdőso, kurio didžiulė neišspręstų problemų kolekcija tapo AI išbandymo aikštele, problemos versiją.

Visiems, skeptiškai žiūrintiems į mašinų intelektą, tai stebinantis rezultatas – ir ne vienintelis. AI įrankiai tapo visur paplitę matematikoje – nuo į formalizavimą orientuotų LLM, tokių kaip Harmonic's Aristotle, iki literatūros peržiūros įrankių, tokių kaip OpenAI gilūs tyrimai. Tačiau nuo GPT 5.2 išleidimo, kurį Somani apibūdina kaip „anekdotiškai labiau įgudusius matematinius samprotavimus nei ankstesnės iteracijos“, tapo sunku ignoruoti didžiulį išspręstų problemų kiekį, todėl kyla naujų klausimų apie didelių kalbos modelių gebėjimą peržengti žmogaus žinių ribas.

Somani nagrinėjo Erdős problemas – daugiau nei tūkstančio vengrų matematiko spėjimų rinkinį, kuris palaikomas internete. Problemos tapo viliojančiu AI valdomos matematikos taikiniu, labai skiriasi tiek dalyku, tiek sunkumu. Pirmoji savarankiškų sprendimų partija atsirado lapkritį iš Gemini varomo modelio, pavadinto AlphaEvolve, tačiau neseniai Somani ir kiti pastebėjo, kad GPT 5.2 puikiai tinka aukšto lygio matematikai.

Nuo Kalėdų Erdős svetainėje 15 problemų buvo perkeltos iš „atvirų“ į „išspręstas“, o 11 sprendimų konkrečiai priskiriami dirbtinio intelekto modeliams, dalyvaujantiems procese.

Gerbiamas matematikas Terence'as Tao savo „GitHub“ puslapyje žvelgia į pažangą niuansingiau, suskaičiuodamas aštuonias skirtingas problemas, kuriose AI modeliai padarė reikšmingą savarankišką pažangą sprendžiant Erdős problemą, ir šešis kitus atvejus, kai pažanga buvo padaryta nustatant ir remiantis ankstesniais tyrimais. Dar toli nuo AI sistemų, galinčių atlikti matematiką be žmogaus įsikišimo, tačiau akivaizdu, kad dideli modeliai turi atlikti svarbų vaidmenį.

Techcrunch renginys

San Franciskas
|
2026 m. spalio 13-15 d

„Mastodon“ Tao spėjo, kad keičiamo AI sistemų pobūdis leidžia jas „geriau sistemingai taikyti sprendžiant neaiškių Erdős problemų „ilgąją uodegą“, iš kurių daugelis iš tikrųjų turi paprastus sprendimus“.

„Daugelis šių lengvesnių Erdős problemų dabar labiau tikėtina, kad bus išspręstos grynai AI pagrįstais metodais, o ne žmogaus ar hibridinėmis priemonėmis“, – tęsė Tao.

Kita varomoji jėga yra pastaruoju metu perėjimas prie formalizavimo, daug darbo reikalaujančios užduoties, dėl kurios matematinį samprotavimą lengviau patikrinti ir išplėsti. Formalizacija nereikalauja dirbtinio intelekto ar net kompiuterių, tačiau naujas automatinių įrankių rinkinys labai palengvino procesą. Atvirojo kodo „įrodinėjimo asistentas“ Lean, sukurtas „Microsoft Research“ 2013 m., buvo plačiai naudojamas šioje srityje kaip įrodymo formalizavimo būdas, o AI įrankiai, tokie kaip „Harmonic's Aristotle“, žada automatizuoti didžiąją dalį formalizavimo darbų.

„Harmonic“ įkūrėjui Tudorui Achimui staigus išspręstų Erdős problemų šuolis yra mažiau svarbus nei tai, kad didžiausi pasaulio matematikai pradeda rimtai žiūrėti į šias priemones. „Man labiau rūpi tai, kad matematikos ir informatikos profesoriai naudoja (AI įrankius), – sakė Achimas. „Šie žmonės turi saugoti reputaciją, todėl kai jie sako, kad naudojasi Aristoteliu arba ChatGPT, tai yra tikras įrodymas.

Nuoroda į informacijos šaltinį