Для тренування національної мовної моделі (LLM) «Сяйво» Державна архівна служба України передала 10 терабайтів інформації.

Про це повідомило Міністерство цифрової трансформації.

«Уявіть масив інформації, що дорівнює 70 тисячам книжок. Саме стільки — 10 терабайтів унікальних історичних матеріалів, державних документів та наукових текстів — Державна архівна служба України вперше передає для тренування національної мовної моделі «Сяйво», – йдеться в повідомленні.

Наголошується, що це перший кейс, коли Укрдержархів ділиться даними для розвитку цифрових сервісів в Україні. До кінця року кількість цифрових копій держархівів збільшаться зі 150 млн до понад 200 млн — це один із найвищих у світі темпів оцифрування архівної спадщини.

Модель вивчатиме історичні джерела, рукописи, закони, судові рішення, медіаматеріали та словники.

Наразі для тренування LLM свої матеріали надають вже понад 50 партнерів Мінцифри, серед яких медіа, університети, бібліотеки тощо.

Нагадаємо, нещодавно понад 136 тисяч українців взяли участь у голосуванні, обираючи ім’я для штучного інтелекту. Переможцем голосування за назву для національної великої мовної моделі ШІ (LLM) стало «Сяйво».