DeepSeek представи DeepSeekMath-V2, следващо поколение математически модел на разсъждение, изграден около самопроверяваща се рамка за обучение. Разработена на базата на DeepSeek V3.2-Exp-Base, системата използва модул за проверка, базиран на голям език, за да проверява автоматично коректността на генерираните математически доказателства, като същевременно непрекъснато усъвършенства своята производителност, използвайки все по-предизвикателни проби с висока трудност.

Моделът демонстрира резултати от най-високо ниво на големи състезания – представяне на ниво златен медал на IMO 2025 и CMO 2024 и впечатляващите 118/120 на изпита Putnam 2024. Според екипа тези резултати потвърждават осъществимостта на „самопроверяващи се пътища за разсъждение“, предлагайки обещаваща посока за изграждане на надеждни, високонадеждни системи за математическо разузнаване.

И кодът, и теглото на модела са с отворен код и вече са достъпни в Hugging Face и GitHub.

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin