У пошуку будучыні

Big Data — 2018: вялікая размова ў БДУІР

На пачатку мая ў Беларускім дзяржаўным універсітэце інфарматыкі і радыёэлектронікі прайшла VІ Міжнародная навукова-практычная канферэнцыя Big Data — 2018. Мерапрыемства аб’яднала больш за 300 экспертаў з навукі і бізнесу.

Сёлетняя канферэнцыя была прысвечана ключавым тэмам Дэкрэта № 8 “Аб развіцці лічбавай эканомікі” — апрацоўцы вялікіх масіваў даных, тэхналогіям штучнага інтэлекту, якія прымяняюцца ў бізнесе, медыцыне, адукацыі, дзяржаўным кіраванні і іншых сферах.

Вопытам абмяняліся навукоўцы з 16 краін, у тым ліку з Францыі, Кітая, Казахстана, Галандыі, Германіі, Вялікабрытаніі. Беларускі бок прадстаўлялі БДУІР,  Аб’яднаны інстытут праблем інфарматыкі НАН Беларусі, IT-кампаніі — партнёры канферэнцыі (EPAM Systems, 1С-Бітрыкс у Беларусі і інш.). На пленарных пасяджэннях і майстар-класах дакладчыкі абмеркавалі апошнія адкрыцці, дасягненні і інструменты работы з тэхналогіямі вялікіх даных і праблемы штучнага інтэлекту.

“Дэкрэт № 8 ужо ўступіў у сілу і даў вялікія магчымасці Парку высокіх тэхналогій, — падкрэсліў рэктар БДУІР Міхаіл Батура на адкрыцці канферэнцыі ў Нацыянальнай бібліятэцы. — Пры ўра­дзе створаны савет па развіцці лічбавай эканомікі. Вялікія даныя — ключавы складнік гэтых тэхналогій”.

Першы намеснік міністра сувязі і інфарматызацыі Дзмітрый Шадко, выступаючы на адкрыцці Big Data — 2018, адзначыў: “Беларуская палітыка ў IT-сферы будуецца на сумеснай рабоце прадпрымальнікаў, дзяржавы і навукоўцаў. Кожнае рашэнне — гэта плён сур’ёзных сумесных намаганняў”.

Прадстаўнікі БДУІР расказалі, што ўніверсітэт надае развіццю Big Data вельмі важнае значэнне. Адкрыта практыка-арыентаваная магістратура па тэхналогіях апрацоўкі вялікіх масіваў даных, працуе вылічальны кластар NVIDIA і лабараторыя высокапрадукцыйных вылічэнняў, вядуцца сумесныя праекты з IТ-кампаніямі ЗША і Канады, што спецыялізуюцца на даследаваннях у галіне Big Data.

Большасць тэхналогій, якія будуць у 2050 годзе, яшчэ не вынайдзены

Пра актуальнасць канферэнцыі Big Data — 2018, шматабяцальную перспектыву згаданых тэхналогій і падрыхтоўку адпаведных кадраў “Настаўніцкай газеце” расказалі загадчык кафедры інжынернай псіхалогіі і эрганомікі БДУІР Канстанцін ЯШЫН і дацэнт кафедры Віталь АСІПОВІЧ.

— Што такое Big Data? Чаму цікавасць да гэтай тэхналогіі настолькі высокая?

— Аналіз вялікіх масіваў даных, распрацоўка новых высокапрадукцыйных сістэм вылічэнняў і захоўвання даных, новыя суперкамп’ютарныя тэхналогіі і дадаткі — сёння гэта найважнейшыя кірункі навуковых даследаванняў у IT-сферы. Асаблівае месца займаюць міжгаліновыя даследаванні і распрацоўкі, звязаныя з інфармацыйнымі тэхналогіямі (напрыклад, прадказальнае і віртуальнае імітацыйнае мадэляванне).

Згодна са Стратэгіяй “Навука і тэхналогіі 2018—2040”, да 2040 года ў Беларусі павінна быць забяспечана “паўсюднае прымяненне камп’ютарных тэхналогій і інтэлектуальных сістэм у вытворчасці і сацыякультурнай сферы, дзяржаўным кіраванні, абароне”, а “ініцыятывы па інтэлектуалізацыі і лічбавай індустрыялізацыі павінны стаць часткай нацыянальнай ідэі па развіцці Беларусі. Дамінуючым прынцыпам інтэлектуальнай эканомікі Беларусі павінна стаць правіла “Абганяць, не даганяючы”.

Работа з вялікімі данымі — гэта неабходны этап пераходу да Індустрыі 4.0, калі вытворчасць прадукцыі стане індывідуальнай і даступнай кожнаму. Гэта значыць, замовіць выраб ці партыю вырабаў можна будзе праз інтэрнэт — і аўтаматызаваны завод забяспечыць адгрузку ВАМ ВАШАГА тавару па
ВАШЫХ патрабаваннях да яго складу і знешняга выгляду.

— Хто праявіў найбольшую цікавасць да канферэнцыі?

— Тыя, хто хоча атрымаць веды аб апошніх дасягненнях у галіне Big Data. Гэта кампаніі, якія займаюцца распрацоўкай праграмнага забеспячэння; бізнесмены і кампаніі, якія жадаюць даведацца, як атрымаць выгаду ад Big Datа; выкладчыкі, зацікаўленыя ў тым, каб узбагаціць свае дысцыпліны тэмамі, звязанымі з Big Data; навукоўцы з ведамі па статыстыцы, тэорыі верагоднасці, штучным інтэлекце і аптымізацыі, якія хацелі б пашырыць сферу сваёй прафесійнай дзейнасці з выкарыстаннем дасягненняў у галіне Big Data; студэнты, якія жадаюць пабуда­ваць кар’еру ў гэтай надзвычай запатрабаванай сферы.

— Сама назва Big Data (вялікія даныя) сведчыць пра тое, што гэта вель­мі шырокая сфера ­дзейнасці, якая патрабуе аб’яд­нан­ня намаганняў лю­дзей з розных сфер дзейнасці…

— Сапраўды, для вырашэння задач у галіне Big Data патрэбна сумесная работа розных прадпрыемстваў, арганізацый і ўстаноў. Адной з такіх устаноў у нашай краіне з’яўляецца БДУІР, дзе за апошняе дзесяцігоддзе створаны сур’ёзны навуковы зачын, сфарміраваны кадравыя і матэрыяльна-тэхнічныя рэсурсы, неабходныя для такой работы.

Так, у БДУІР актыўна працуе навуковая школа ў галіне штучнага інтэлекту. Абараняюцца навуковыя дысертацыі, вынікі ўкараняюцца ў рэальны сектар эканомікі. Сфера кампетэнцый — стварэнне і кіраванне базамі ведаў, рашэнне інтэлектуальных задач з прымяненнем баз ведаў. Яскравым сведчаннем прызнання дасягненняў школы навуковай грамадскасцю з’яўляецца рэгулярная міжнародная навуковая канферэнцыя OSTIS — “Адкрытыя семантычныя тэхналогіі і сістэмы”.

У БДУІР створана і функцыянуе лабараторыя высокапрадукцыйных вылічэнняў, працуе вылічальны кластар NVIDIA. Сфера кампетэнцый — распазнаванне вобразаў, інтэ­лектуальныя сістэмы тэхнічнага зроку, апрацоўка і распазнаванне гукаў, стварэнне высокапрадукцыйных праблемна-арыентаваных працэсараў. У рамках Дзяржаўнай праграмы навуковых даследаванняў “Інфарматыка, космас” з 2016 года выконваецца навукова-даследчая работа “Распрацоўка інтэлектуальнай вылічальнай сістэмы апрацоўкі вялікіх аб’ёмаў даных”. Міжнародны ўзровень навуковых работ пацвярджаецца рэгулярнай арганізацыяй канферэнцый серыі PRIP (Pattern Recognition and Information Processing).

І, вядома, важным дасягненнем для БДУІР з’яўляецца штогадовае правядзенне Міжнароднай навукова-практычнай канферэнцыі Big Data.

Варта адзначыць узаемадзеянне ўніверсітэта з іншымі арганізацыямі і навуковымі калектывамі. Так, БДУІР падтрымлівае цесную сувязь з вядомымі ў згаданай галіне навукоўцамі з БДУ, БрДТУ, Аб’яднанага інстытута праблем інфарматыкі НАН Беларусі, Аб’яднанага інстытута машынабудавання НАН Беларусі і інш.

— Ці ўзаемадзейнічае БДУІР з замежнымі арганізацыямі ў гэтай сферы?

 — Так. Па-першае, БДУІР супрацоўнічае з усімі прадпрыемствамі — арганізатарамі штогадовай канферэнцыі Big Data. Адным з прыкладаў такога супрацоўніцтва з’яўляецца работа з карпарацыяй IBM.

Не так даўно гэтая карпарацыя ўклала больш за $1 млрд у развіццё воблачнай платформы IBM Cloud. Гэта магутны комплекс тэхналогій і сэрвісаў, які дазваляе кліентам кампаніі вырашаць вельмі шырокае кола задач. Як вядома, воблачныя вылічэнні — гэта мадэль прадастаўлення вылічальных рэсурсаў (ад асобных дадаткаў — да буйных цэнтраў апрацоўкі даных) праз інтэрнэт з аплатай па факце выкарыстання. Асноўная задача такіх цэнтраў заключаецца ў хуткай апрацоўцы любога аб’ёму даных, захоўванні інфармацыі і яе выдачы карыстальніку ў стандартызаваным выглядзе.

Платформа IBM Cloud уяўляе сабой набор воблачных сэрвісаў, якія выкарыстоўваюць прынцып віртуалізацыі — стварэнне праграмных прадуктаў і разгортванне сервернага абсталявання віртуальна. Віртуалізацыю выкарыстоўваюць для дадаткаў, сервераў, сістэм захоўвання даных і лакальных сетак. Гэта досыць эфектыўны спосаб скарачэння выдаткаў на стварэнне ІТ-інфраструктуры любой арганізацыі. IBM Cloud забяспечвае імгненны доступ да неабходных вылічальных рэсурсаў для хуткага старту, бесперапыннага развіцця і паспяховага маштабавання. Службы для мабільных дадаткаў, інтэрнэту рэчаў, Watson і г.д. робяць IBM Cloud зручнай платформай.

Трэба адзначыць, што кафедра інжынернай псіхалогіі і эрганомікі БДУІР атрымала доступ да воблачнай платформы ад IBM. Гэта дазваляе нам захоўваць і працаваць з вялікімі аб’ёмамі інфармацыі. IBM Cloud бярэ на сябе настройку інфраструктуры, падрыхтоўку рэсурсаў і хостынг.

— БДУІР рыхтуе спецыялістаў у галіне Big Data?

— У 2016 годзе на кафедры інжынернай псіхалогіі і эрганомікі прайшла апрабацыя трох дысцыплін: “Уводзіны ў вялікія даныя”, “Мова праграмавання R для аналізу вялікіх даных” і “Алгарытмы машыннага навучання”. Цяпер гэтыя дысцыпліны ўкаранілі ў працэс навучання студэнтаў 4 курса і магістрантаў.

Напрыклад, пасля праходжання курса “Алгарытмы машыннага навучання” студэн­ты гатовы практычна падыходзіць да вырашэння такіх задач, як стварэнне базавай мадэлі прагназавання, работа з матрыцай недакладнасцей, кластарызацыя відаў, класіфікацыя і фільтраванне спама ў пошце, мадэляванне будучых праглядаў уліковых запісаў у сацыяльнай сетцы LinkedIn і інш.

— Можаце прывесці прыклады рашэння практычных задач у згаданай сферы?

— Прыклад з вобласці інтэрнэту рэчаў. Гэта задача, над якой мы зараз працуем. Штогод у свеце расце колькасць сонечных электрастанцый (летась уведзена ў работу больш за 100 ГВт). Кожная сонечная панэль на электрастанцыі забяспечана датчыкам, які здымае параметры яе работы і накіроўвае на сервер. Калі для маніторынгу ёсць элементная база (датчыкі) і інструменты (інтэрнэт-серверы), то аналіз і прагназаванне ўяўляюць пэўныя складанасці. Інфармацыя аб рабоце адной сонечнай панэлі ўключае наступныя параметры: сіла току, напружанне, тэмпература, узровень сонечнай радыяцыі, дата і час вымярэння. Гэтыя даныя збіраюцца на серверы і падаюцца карыстальніку ў выглядзе графікаў ці табліц. Пры зняцці значэнняў з інтэрвалам у 5 мінут сонечныя электрастанцыі, уведзеныя ў эксплуатацыю ў 2017 годзе, будуць генерыраваць 10 Гбіт інфармацыі ў дзень. І нават аналіз зніжэння эфектыўнасці работы асобна ўзятай электрастанцыі (ці сонечнай панэлі) ускладняецца зменлівасцю ўмоў надвор’я і пастаянным ростам колькасці даных.

Простая задача: знайсці сонечныя па­нэлі, эфектыўнасць якіх знізілася на 20% (бо вытворца дае гарантыю і панэль можна замяніць). Ёсць два шляхі вырашэння праблемы:

  1. Выкарыстоўваць алгарытмы машыннага навучання для аналізу эфектыўнасці кожнай панэлі на працягу пэўнага перыяду (або ўключаць гэты аналіз перыядычна і адсочваць зніжэнне эфектыўнасці панэлей на электрастанцыі). Каб забяспечыць работу такой сістэмы маніторынгу, спатрэбяцца даволі магутныя камп’ютары і доўгі працэс навучання алгарытму.
  2. Выкарыстоўваць канцэпцыю “лічбавы двайнік”. Апрабацыя гэтай канцэпцыі зараз праходзіць сумесна з кампаніяй “Сэнса­троніка”. Сутнасць заключаецца ў тым, што ствараецца мадэль кожнай працуючай сонечнай панэлі (лічбавы двайнік). Гэтая ма­дэль — эталон. Параметры лічбавых двайнікоў запісваюцца і захоўваюцца. У працэсе работы сонечнай электрастанцыі перыядычна ажыццяўляецца разлік бягучага значэння эфектыўнасці і параўнанне гэтага значэння з эфектыўнасцю лічбавага двайніка пры аднолькавых уваходных параметрах (асветленасць і тэмпература). Выкарыстоўваючы даныя абмежаваных прамежкаў часу, мы не маем патрэбы ў вялікіх разліках. І гэта толькі адна задача, якую дазваляе вырашыць лічбавы двайнік.

А ўвогуле, магчымасці прымянення камп’ютарных тэхналогій і інтэлектуальных сістэм у вытворчасці невымерныя. Як адзначалі многія эксперты канферэнцыі Big Data, большасць тэхналогій, якія будуць праца­ваць у 2050 годзе, яшчэ нават не вынайдзена.

Падрыхтавала Галіна СІДАРОВІЧ.
Фота прадастаўлены прэс-службай БДУІР.

Пакінуць каментарый

Ваш электронны адрас не будзе апублікаваны. Абавязковыя палі пазначаны *