
ДаркБЕРТ је четбот генеративне вештачке интелигенције обучаван на подацима са дарк њеба који је недавно лансиран у Јужној Кореји у научне сврхе. Велики језички модели засновани на вештачкој интелигенцији као што је светски популаран четбот ЧетГПТ, обучавани су на огромним базама података, укључујући и оне доступне на интернету. То, између осталог, треба да обезбеди што боље корисничко искуство и тачност информација које пружа.
Међутим, неки од таквих четботова су донедавно били ограничени на информације са интернета доступне до 2021. године, а треба напоменути и да су то информације доступне на „обичном“, односно јавно доступном интернету.
Научници у Јужној Кореји су развој вештачке интелигенције управо подигли на нови ниво тиме што су лансирали четбот ДаркБЕРТ који користи податке са дарк њеба. Дарк веб, даркнет или дип веб је у ствари низ сервера који нису јавно регистровани на претраживачима, јер људи који их користе желе да остану ван очију јавности и закона, из често нелегалних разлога.
„Обични“ четботови као што је ЧетГПТ у међувремену су постали толико напредни, да за вас могу креирати есеје, писати програмске кодове, па чак направити и високо напредни малвер софтвер.
Са доласком ДаркБЕРТ четбота, могућности генеративне вештачке интелигенције добијају још већу димензију. Она сада може да проналази и анализира нове информације са дарк њеба и тиме помогне стручњацима за сајбер безбедност као и органима реда да дубље продру у његов садржај и санкционишу нелегалне активности.

Како је ДаркБЕРТ четбот обучаван
ДаркБЕРТ је заснован на РоБЕРТ архитектури, приступу развоја вештачке интелигенције који је у оптицају још од 2019, али су научници сада открили да овај приступ заправо омогућава много више перформанси него што су из њега могли да извуку у то време. Приметили су да је тај модел тада био недовољно обучен, а што му није дало потребну ефикасност за коју је био способан.
Да би лансирали ДаркБЕРТ, научници су претражили мрачну страну интернета преко анонимног Тор прегледача који је обезбеђен заштитном баријером (фајервол) између приватне интерне мреже и јавно доступног интернета. Потом су филтрирали необрађене податке да би генерисали дарк њеб базу података. Резултат тога је да се она користи за покретање ДаркБЕРТ четбота који може да анализира нове податке које пронађе на даркнету и извуче корисне информације из њега.
Ово показује да је ДаркБЕРТ практично надмашио друге велике језичке моделе, који ће сигурно доста користити дигиталним форензичарима, где ће се вероватно највише и користити. Но, то не значи ни да је ово финални ДаркБЕРТ модел, с обзиром на то да се генеративна вештачка интелигенција све више развија, па тако можемо очекивати и да ће он бити додатно унапређен. Наравно, као и за друге четботове, и за ДаркБЕРТ важи да у будућности може бити злоупотребљен уколико се недовољно регулише у употреби, па тако може завршити не само у рукама етичких, већ и црних хакера.
Сара Смоловић
Извор: Бенчмарк
