Akceptu kiel datumojn: kiel entreprenoj lernas profiti el grandaj datumoj

Analizante grandajn datumojn, kompanioj lernas malkovri kaŝitajn ŝablonojn, plibonigante sian komercan rendimenton. La direkto estas moda, sed ne ĉiuj povas profiti el grandaj datumoj pro la manko de kulturo labori kun ili

“Ju pli ofta estas la nomo de homo, des pli verŝajne ili pagi ĝustatempe. Ju pli da etaĝoj havas via domo, des pli statistike vi estas pli bona prunteprenanto. La signo de la zodiako preskaŭ ne efikas sur la probableco de repago, sed la psikotipo signife faras, "diras Stanislav Duzhinsky, analizisto de Home Credit Bank, pri neatenditaj ŝablonoj en la konduto de prunteprenantoj. Li ne entreprenas klarigi multajn el ĉi tiuj ŝablonoj - ili estis malkaŝitaj de artefarita inteligenteco, kiu prilaboris milojn da klientprofiloj.

Jen la potenco de analizo de grandaj datumoj: analizante grandegan kvanton da nestrukturitaj datumoj, la programo povas malkovri multajn korelaciojn, pri kiuj la plej saĝa homa analizisto eĉ ne scias. Ajna kompanio havas grandegan kvanton da nestrukturitaj datumoj (grandaj datumoj) - pri dungitoj, klientoj, partneroj, konkurantoj, kiuj povas esti uzataj por komerca profito: plibonigi la efikon de promocioj, atingi vendon kreskon, redukti dungitaron, ktp.

La unuaj, kiuj laboris kun grandaj datumoj, estis grandaj kompanioj pri teknologio kaj telekomunikado, financaj institucioj kaj podetala komerco, komentas Rafail Miftakhov, direktoro de la Grupo de Integriĝo pri Teknologio Deloitte, CIS. Nun ekzistas intereso pri tiaj solvoj en multaj industrioj. Kion atingis kompanioj? Kaj ĉu analizo de grandaj datumoj ĉiam kondukas al valoraj konkludoj?

Ne facila ŝarĝo

Bankoj uzas grandajn datumajn algoritmojn ĉefe por plibonigi klientan sperton kaj optimumigi kostojn, kaj ankaŭ por administri riskon kaj batali fraŭdon. "En la lastaj jaroj, vera revolucio okazis en la kampo de analizo de grandaj datumoj," diras Duĵinskij. "La uzo de maŝina lernado ebligas al ni antaŭdiri la probablecon de prunto-defaŭlto multe pli precize - delikteco en nia banko estas nur 3,9%." Por komparo, ekde la 1-a de januaro 2019, la proporcio de pruntoj kun prokrastaj pagoj pli ol 90 tagojn pri pruntoj donitaj al individuoj estis, laŭ la Centra Banko, 5%.

Eĉ mikrofinancaj organizoj estas konfuzitaj de la studo de grandaj datumoj. "Provigi financajn servojn sen analizi grandajn datumojn hodiaŭ estas kiel fari matematikon sen nombroj," diras Andrey Ponomarev, Ĉefoficisto de Webbankir, interreta pruntplatformo. "Ni elsendas monon interrete sen vidi nek la klienton nek lian pasporton, kaj male al tradicia pruntedonado, ni devas ne nur taksi la solvecon de homo, sed ankaŭ identigi lian personecon."

Nun la datumbazo de la kompanio konservas informojn pri pli ol 500 mil klientoj. Ĉiu nova aplikaĵo estas analizita kun ĉi tiuj datumoj en ĉirkaŭ 800 parametroj. La programo konsideras ne nur sekson, aĝon, edzecan staton kaj kredithistorion, sed ankaŭ la aparaton, de kiu persono eniris la platformon, kiel li kondutis en la retejo. Ekzemple, povas esti alarme, ke ebla prunteprenanto ne uzis pruntkalkulilon aŭ ne demandis pri la kondiĉoj de prunto. "Krom kelkaj haltfaktoroj - ekzemple, ni ne donas pruntojn al personoj malpli ol 19-jaraj - neniu el ĉi tiuj parametroj en si mem estas kialo por rifuzi aŭ konsenti doni prunton," Ponomarev klarigas. Gravas la kombinaĵo de faktoroj. En 95% de kazoj, la decido estas farita aŭtomate, sen la partopreno de specialistoj de la subskriba fako.

Provizi financajn servojn sen analizi grandajn datumojn hodiaŭ estas kiel fari matematikon sen nombroj.

Analizo de grandaj datumoj permesas al ni derivi interesajn ŝablonojn, Ponomarev dividas. Ekzemple, uzantoj de iPhone montriĝis pli disciplinitaj prunteprenantoj ol posedantoj de Android-aparatoj - la unuaj ricevas aprobon de aplikoj 1,7 fojojn pli ofte. "La fakto, ke militistaro ne repagos pruntojn preskaŭ kvaronon malpli ofte ol la averaĝa prunteprenanto ne estis surprizo," Ponomarev diras. "Sed oni kutime ne atendas ke studentoj estas devigataj, sed dume, kazoj de kreditdefaŭltoj estas 10% malpli oftaj ol la mezumo por la bazo."

La studo de grandaj datumoj permesas poentadon ankaŭ por asekuristoj. Establita en 2016, IDX okupiĝas pri fora identigo kaj reta konfirmo de dokumentoj. Ĉi tiuj servoj estas postulataj inter ŝarĝaj asekuristoj, kiuj interesiĝas pri la perdo de varoj kiel eble plej malmulte. Antaŭ ol certigi la transportadon de varoj, la asekuristo, kun la konsento de la ŝoforo, kontrolas la fidindecon, klarigas Jan Sloka, komerca direktoro de IDX. Kune kun partnero - la Sankt-Peterburga kompanio "Risko-Kontrolo" - IDX evoluigis servon, kiu ebligas al vi kontroli la identecon de la ŝoforo, pasportajn datumojn kaj rajtojn, partoprenon en incidentoj rilataj al la perdo de kargo ktp. Post analizo. la datumbazo de ŝoforoj, la firmao identigis "riskan grupon": plej ofte, kargo estas perdita inter ŝoforoj aĝaj 30-40 jaroj kun longa vetursperto, kiuj ofte ŝanĝis laboron lastatempe. Ankaŭ montriĝis, ke la kargo estas plej ofte ŝtelita de aŭtoveturistoj, kies funkcidaŭro superas ok jarojn.

Serĉante

Podetalistoj havas malsaman taskon - identigi klientojn, kiuj pretas aĉeti, kaj determini la plej efikajn manierojn alporti ilin al la retejo aŭ vendejo. Tiucele, la programoj analizas la profilon de klientoj, datumojn de sia persona konto, la historion de aĉetoj, serĉodemandojn kaj la uzon de bonus poentoj, la enhavon de elektronikaj korboj, kiujn ili komencis plenigi kaj forlasis. Datumanalitiko permesas vin segmenti la tutan datumbazon kaj identigi grupojn de eblaj aĉetantoj, kiuj eble interesiĝas pri aparta oferto, diras Kirill Ivanov, direktoro de la datuma oficejo de la grupo M.Video-Eldorado.

Ekzemple, la programo identigas grupojn de klientoj, ĉiu el kiuj ŝatas malsamajn merkatajn ilojn - seninterezan prunton, monon aŭ rabatan reklamkodon. Ĉi tiuj aĉetantoj ricevas retpoŝtan bultenon kun la responda promocio. La probablo, ke persono, malferminte la leteron, iros al la retejo de la kompanio, en ĉi tiu kazo signife pliiĝas, notas Ivanov.

Analizo de datumoj ankaŭ permesas pliigi vendojn de rilataj produktoj kaj akcesoraĵoj. La sistemo, kiu prilaboris la mendhistorion de aliaj klientoj, donas al la aĉetanto rekomendojn pri tio, kion aĉeti kune kun la elektita produkto. Testado de ĉi tiu metodo de laboro, laŭ Ivanov, montris pliiĝon de la nombro de mendoj kun akcesoraĵoj je 12% kaj pliiĝon de la spezo de akcesoraĵoj je 15%.

Podetalistoj ne estas la solaj, kiuj klopodas plibonigi la kvaliton de servo kaj pliigi vendojn. La pasinta somero, MegaFon lanĉis "inteligentan" ofertan servon bazitan sur la prilaborado de datumoj de milionoj da abonantoj. Studinte ilian konduton, artefarita inteligenteco lernis formi personajn ofertojn por ĉiu kliento ene de la tarifoj. Ekzemple, se la programo notas, ke persono aktive spektas videon sur sia aparato, la servo proponos al li pligrandigi la kvanton de movebla trafiko. Konsiderante la preferojn de uzantoj, la kompanio provizas abonantojn per senlima trafiko por siaj plej ŝatataj interreta libertempo - ekzemple, uzante tujmesaĝilojn aŭ aŭskulti muzikon per streaming-servoj, babili en sociaj retoj aŭ spekti televidajn programojn.

"Ni analizas la konduton de abonantoj kaj komprenas kiel iliaj interesoj ŝanĝas," klarigas Vitaly Shcherbakov, direktoro de analizo de grandaj datumoj ĉe MegaFon. "Ekzemple, ĉi-jare, AliExpress-trafiko kreskis 1,5 fojojn kompare kun la pasinta jaro, kaj ĝenerale, la nombro da vizitoj al interretaj vestaĵbutikoj kreskas: 1,2-2 fojojn, depende de la specifa rimedo."

Alia ekzemplo de la laboro de telefonisto kun grandaj datumoj estas la MegaFon Poisk-platformo por serĉi malaperintajn infanojn kaj plenkreskulojn. La sistemo analizas kiuj homoj povus esti proksime de la loko de la malaperinta persono, kaj sendas al ili informojn kun foto kaj signoj de la malaperinta persono. La operatoro disvolvis kaj provis la sistemon kune kun la Ministerio pri Internaj Aferoj kaj la organizo Lisa Alert: ene de du minutoj de orientiĝo al la malaperinta, ricevas pli ol 2 mil abonantoj, kio signife pliigas la ŝancojn de sukcesa serĉrezulto.

Ne iru al la PUB

Granda datuma analizo ankaŭ trovis aplikon en industrio. Ĉi tie ĝi permesas al vi antaŭvidi postulon kaj plani vendojn. Do, en la grupo de kompanioj Cherkizovo, antaŭ tri jaroj, estis efektivigita solvo bazita sur SAP BW, kiu permesas vin stoki kaj prilabori ĉiujn vendajn informojn: prezoj, sortimento, produktaj volumoj, promocioj, distribuaj kanaloj, diras Vladislav Belyaev, CIO. de la grupo ” Ĉerkizovo. La analizo de la amasigitaj 2 TB de informoj ne nur ebligis efike formi la sortimenton kaj optimumigi la produktan biletujon, sed ankaŭ faciligis la laboron de dungitoj. Ekzemple, prepari ĉiutagan vendan raporton postulus tagan laboron de multaj analizistoj - du por ĉiu produktsegmento. Nun ĉi tiu raporto estas preparita de la roboto, pasigante nur 30 minutojn por ĉiuj segmentoj.

"En industrio, grandaj datumoj funkcias efike kune kun la Interreto de aferoj," diras Stanislav Meshkov, Ĉefoficisto de Umbrella IT. "Surbaze de la analizo de datumoj de la sensiloj, per kiuj la ekipaĵo estas ekipita, eblas identigi deviojn en ĝia funkciado kaj malhelpi paneojn, kaj antaŭdiri rendimenton."

En Severstal, helpe de grandaj datumoj, ili ankaŭ provas solvi sufiĉe ne-trivialajn taskojn - ekzemple redukti vundajn indicojn. En 2019, la kompanio asignis ĉirkaŭ 1,1 miliardojn da rubloj por rimedoj por plibonigi laboran sekurecon. Severstal atendas redukti la vundan indicon je 2025% per 50 (kompare kun 2017). "Se linimanaĝero - skipestro, ejo-manaĝero, butiko-manaĝero - rimarkis, ke oficisto faras iujn operaciojn nesekure (ne tenas sin al la manregloj kiam grimpas ŝtuparon ĉe la industria ejo aŭ ne portas ĉiujn personajn protektajn ekipaĵojn), li skribas. speciala noto al li – PAB (de "kondutsekureca revizio"),” diras Boris Voskresensky, estro de la fako de analizo de datumoj de la kompanio.

Analizinte datumojn pri la nombro da PAB-oj en unu el la sekcioj, la specialistoj de la kompanio trovis, ke la sekurecaj reguloj plej ofte estas malobservitaj de tiuj, kiuj jam antaŭe havis plurajn rimarkojn, kaj ankaŭ de tiuj, kiuj estis en malsanforpermeso aŭ feriaj baldaŭ antaŭe. la okazaĵo. Malobservoj en la unua semajno post reveno de ferioj aŭ malsanforpermeso estis duoble pli altaj ol en la posta periodo: 1 kontraŭ 0,55%. Sed labori en la nokta deĵoro, kiel evidentiĝis, ne influas la statistikojn de PAB-oj.

Sen kontakto kun la realo

Krei algoritmojn por prilaborado de grandaj datumoj ne estas la plej malfacila parto de la laboro, diras reprezentantoj de la kompanio. Estas multe pli malfacile kompreni kiel ĉi tiuj teknologioj povas esti aplikataj en la kunteksto de ĉiu specifa komerco. Jen kie kuŝas la kalkano de Aĥilo de firmaaj analizistoj kaj eĉ eksteraj provizantoj, kiuj, ŝajne, amasigis kompetentecon en la kampo de grandaj datumoj.

"Mi ofte renkontis analizistojn pri grandaj datumoj, kiuj estis bonegaj matematikistoj, sed ne havis la necesan komprenon pri komercaj procezoj," diras Sergey Kotik, direktoro pri disvolviĝo ĉe GoodsForecast. Li memoras, kiel antaŭ du jaroj lia kompanio havis la ŝancon partopreni en postula prognoza konkurso por federacia podetala ĉeno. Estis elektita pilota regiono, por ĉiuj varoj kaj vendejoj, pri kiuj la partoprenantoj faris prognozojn. La prognozoj tiam estis komparitaj kun realaj vendoj. La unua loko estis prenita de unu el la rusaj interretaj gigantoj, konata pro sia kompetenteco pri maŝina lernado kaj analizo de datumoj: en siaj prognozoj, ĝi montris minimuman devion de reala vendo.

Sed kiam la reto komencis pli detale studi siajn antaŭvidojn, montriĝis, ke el komerca vidpunkto, ili estas absolute neakcepteblaj. La firmao lanĉis modelon kiu produktis vendoplanojn kun sistema subtakso. La programo eltrovis kiel minimumigi la probablecon de eraroj en prognozoj: estas pli sekure subtaksi vendojn, ĉar la maksimuma eraro povas esti 100% (ne estas negativaj vendoj), sed en la direkto de troprognozo, ĝi povas esti arbitre granda, Kotik klarigas. Alivorte, la kompanio prezentis idealan matematikan modelon, kiu en realaj kondiĉoj kondukus al duonmalplenaj vendejoj kaj grandegaj perdoj pro subvendoj. Kiel rezulto, alia firmao gajnis la konkurson, kies kalkuloj povus esti efektivigitaj.

"Eble" anstataŭ grandaj datumoj

Grandaj datumoj teknologioj estas gravaj por multaj industrioj, sed ilia aktiva efektivigo ne okazas ĉie, Meshkov notas. Ekzemple, en sanservo estas problemo pri konservado de datumoj: amasiĝis multe da informoj kaj ĝi estas regule ĝisdatigita, sed plejparte ĉi tiuj datumoj ankoraŭ ne estis ciferecigitaj. Ankaŭ estas multaj datumoj en registaraj agentejoj, sed ili ne estas kombinitaj en komunan areton. La disvolviĝo de unuigita informa platformo de la Nacia Datuma Administra Sistemo (NCMS) celas solvi ĉi tiun problemon, diras la fakulo.

Tamen nia lando estas malproksima de la sola lando, kie en la plej multaj organizoj gravaj decidoj estas faritaj surbaze de intuicio, kaj ne de analizo de grandaj datumoj. En aprilo de la pasintjare, Deloitte faris enketon inter pli ol mil gvidantoj de grandaj usonaj kompanioj (kun dungitaro de 500 aŭ pli) kaj trovis, ke 63% de la enketitaj konas teknologiojn de grandaj datumoj, sed ne havas ĉiujn necesajn. infrastrukturo por uzi ilin. Dume, inter la 37% de kompanioj kun alta nivelo de analiza matureco, preskaŭ duono signife superis komercajn celojn en la pasintaj 12 monatoj.

La studo malkaŝis, ke krom la malfacileco efektivigi novajn teknikajn solvojn, grava problemo en kompanioj estas la manko de kulturo labori kun datumoj. Vi ne devus atendi bonajn rezultojn, se la respondeco pri decidoj faritaj surbaze de grandaj datumoj estas atribuita nur al la analizistoj de la kompanio, kaj ne al la tuta kompanio entute. "Nun kompanioj serĉas interesajn uzkazojn por grandaj datumoj," diras Miftaĥov. "Samtempe, la efektivigo de iuj scenaroj postulas investojn en sistemoj por kolektado, prilaborado kaj kvalita kontrolo de pliaj datumoj, kiuj antaŭe ne estis analizitaj." Ve, "analitiko ankoraŭ ne estas teama sporto", konfesas la aŭtoroj de la studo.

Lasi Respondon