Hvernig minnkun á AI dregur úr hlutdrægum gagnasettum

Hlutdræg gagnasöfn og siðferðileg AI

AI-knúnar lausnir þurfa gagnasett til að skila árangri. Og sköpun þessara gagnasafna er full af óbeinum hlutdrægni á kerfisbundnu stigi. Allt fólk þjáist af hlutdrægni (bæði meðvitund og meðvitund). Hlutdrægnin getur verið á ýmsan hátt: landfræðileg, málvísindaleg, félags-efnahagsleg, kynferðisleg og kynþáttahatari. Og þessar kerfislægu hlutdrægni eru bakaðar í gögn, sem geta leitt til AI afurða sem viðhalda og auka hlutdrægni. Stofnanir þurfa meðvitaða nálgun til að draga úr hlutdrægni sem læðist inn í gagnasett.

Dæmi sem lýsa hlutdrægni

Eitt athyglisvert dæmi um hlutdrægni gagnasafnsins sem vakti mikla neikvæða pressu á sínum tíma var lausnarferill fyrir ferilskrá sem hagaði karlkyns frambjóðendum fremur en konum. Þetta er vegna þess að gagnasöfn ráðningartækisins höfðu verið þróuð með því að nota ferilskrá frá síðasta áratug þegar meirihluti umsækjenda hafði verið karlkyns. Gögnin voru hlutdræg og niðurstöðurnar endurspegluðu þá hlutdrægni. 

Annað dæmi sem víða hefur verið greint frá: Á árlegri ráðstefnuráðstefnu Google I/O deildi Google forskoðun á AI-knúnu húðsjúkdómatæki sem hjálpar fólki að skilja hvað er að gerast varðandi málefni sem tengjast húð, hári og naglum. Hjúkrunarfræðingurinn í húðsjúkdómum undirstrikar hvernig AI þróast til að hjálpa til við heilsugæslu - en það lagði einnig áherslu á möguleika hlutdrægni til að læðast inn í AI í kjölfar gagnrýni um að tækið sé ekki fullnægjandi fyrir litað fólk.

Þegar Google tilkynnti tólið tók fyrirtækið eftir:

Til að ganga úr skugga um að við séum að byggja fyrir alla, reiknar líkanið okkar frá þáttum eins og aldri, kyni, kynþætti og húðgerðum - allt frá fölri húð sem ekki brúnast í brúna húð sem brennur sjaldan.

Google, með AI til að finna svör við algengum húðsjúkdómum

En grein í Vice sagði að Google hafi ekki notað gagnasett fyrir alla:

Til að sinna verkefninu notuðu vísindamennirnir þjálfunargagnagrunn með 64,837 myndum af 12,399 sjúklingum í tveimur ríkjum. En af þúsundum húðsjúkdóma á myndinni komu aðeins 3.5 prósent frá sjúklingum með Fitzpatrick húðgerðir V og VI - þau sem tákna brúna húð og dökkbrúna eða svarta húð, í sömu röð. 90 prósent gagnagrunnsins voru samsett af fólki með ljósa húð, dekkri hvíta húð eða ljósbrúna húð, samkvæmt rannsókninni. Vegna hlutdrægrar sýnatöku segja húðsjúkdómafræðingar að forritið gæti endað á of- eða vangreiningu á fólki sem er ekki hvítt.

Vice, nýja húðsjúkdómsforritið frá Google var ekki hannað fyrir fólk með dekkri húð

Google svaraði með því að segja að það myndi betrumbæta tólið áður en það var gefið formlega út:

AI-knúið hjálpartæki okkar til húðsjúkdóma er hápunktur meira en þriggja ára rannsóknar. Þar sem verk okkar voru lögð fram í Nature Medicine höfum við haldið áfram að þróa og betrumbæta tækni okkar með því að fella inn viðbótar gagnasöfn sem innihalda gögn sem þúsundir manna hafa gefið, og milljónir fleiri sýndra húðáhyggjumynda.

Google, með AI til að finna svör við algengum húðsjúkdómum

Eins mikið og við gætum vonað að AI og vélanám forrit gætu leiðrétt þessar hlutdrægni, þá er staðreyndin eftir: þau eru aðeins eins sviði þar sem gagnasett þeirra eru hrein. Í uppfærslu á gamla forritunarorðinu rusl inn/rusl út, AI lausnir eru aðeins eins sterkar og gæði gagnasafna þeirra frá upphafi. Án leiðréttingar frá forriturum hafa þessi gagnasett ekki bakgrunnsreynslu til að laga sig sjálf – þar sem þau hafa einfaldlega engan annan viðmiðunarramma.

Að byggja gagnasett á ábyrgan hátt er kjarninn í öllu siðferðileg gervigreind. Og fólk er kjarninn í lausninni. 

Mindful AI er Ethical AI

Skekkja gerist ekki í tómarúmi. Siðlaus eða hlutdræg gagnasöfn koma frá því að hafa ranga nálgun á þróunarstigi. Leiðin til að berjast gegn hlutdrægni villum er að taka upp ábyrga, mannlega miðaða nálgun sem margir í greininni eru að kalla Mindful AI. Mindful AI hefur þrjá mikilvæga þætti:

1. Mindful AI er mannamiðað

Frá upphafi AI verkefnisins, á skipulagsstigi, verða þarfir fólks að vera miðpunktur hverrar ákvörðunar. Og það þýðir allt fólk - ekki bara undirmengi. Þess vegna þurfa verktaki að treysta á fjölbreytt teymi fólks á heimsvísu til að þjálfa AI forrit til að vera án aðgreiningar og hlutdrægni.

Fjölgun gagna frá alþjóðlegu, fjölbreyttu teymi tryggir að hlutdrægni sé auðkennd og síuð út snemma. Þeir sem eru með mismunandi þjóðerni, aldurshópa, kyn, menntunarstig, félags-efnahagslegan bakgrunn og staðsetningar geta auðveldlega komið auga á gagnasett sem styðja eitt verðmæti fram yfir annað og þannig útiloka óviljandi hlutdrægni.

Skoðaðu raddforrit. Þegar beitt er huglægri AI nálgun og nýtir kraft alþjóðlegrar hæfileikasölu geta verktaki gert grein fyrir málfræðilegum þáttum eins og mismunandi mállýskum og áherslum í gagnasettunum.

Það er mikilvægt að koma á fót manngerðum hönnunarramma frá upphafi. Það er langt í átt að því að tryggja að gögnin sem eru búin til, sýnd og merkt uppfylli væntingar endanotenda. En það er líka mikilvægt að halda mönnum í skefjum allan líftíma vöruþróunar. 

Menn í lykkjunni geta einnig hjálpað vélum að búa til betri AI upplifun fyrir hvern sérstakan markhóp. Hjá Pactera EDGE skilja AI -gagnaverkefni okkar, sem eru staðsett á heimsvísu, hvernig mismunandi menning og samhengi getur haft áhrif á söfnun og umsjón með áreiðanlegum AI þjálfunargögnum. Þeir hafa nauðsynleg tæki sem þeir þurfa til að merkja vandamál, fylgjast með þeim og laga þau áður en AI-undirstaða lausn fer í loftið.

Human-in-the-loop AI er verkefni „öryggisnet“ sem sameinar styrkleika fólks-og fjölbreyttan bakgrunn þess með hraðri tölvukrafti véla. Það þarf að koma á þessu mannlegu og AI samstarfi frá upphafi áætlana svo að hlutdræg gögn myndi ekki grunn í verkefninu. 

2. Meðvituð AI er ábyrg

Að vera ábyrgur er að tryggja að AI kerfi séu laus við hlutdrægni og að þau séu byggð á siðfræði. Það snýst um að hafa í huga hvernig, hvers vegna og hvar gögn eru búin til, hvernig þau eru mynduð af AI kerfum og hvernig þau eru notuð til að taka ákvörðun, ákvarðanir sem geta haft siðferðileg áhrif. Ein leið fyrir fyrirtæki til að gera það er að vinna með samfélögum undir fulltrúa til að vera meira aðgreind og hlutdrægari. Á sviði gagnaskýringa eru nýjar rannsóknir að undirstrika hvernig fjölritunarlíkan sem lýsir merkjum hvers og eins sem aðskildrar undirverkefnis getur hjálpað til við að draga úr hugsanlegum atriðum sem fylgja eðlilegum aðferðum grundvallarsanninda þar sem ágreiningur umsagnaraðila getur stafað af undirframsetningu og getur verið hunsað í samantekt athugasemda við einn grundvallarsannleika. 

3. Traust

Áreiðanleiki kemur frá því að fyrirtæki er gagnsætt og útskýrt í því hvernig AI líkanið er þjálfað, hvernig það virkar og hvers vegna þeir mæla með niðurstöðunum. Fyrirtæki þarfnast sérþekkingar með staðfærslu AI til að gera viðskiptavinum sínum kleift að gera AI forrit þeirra meira aðlaðandi og sérsniðna, með virðingu fyrir mikilvægum blæbrigðum í staðbundnu tungumáli og reynslu notenda sem getur gert eða brotið á trúverðugleika AI lausnar frá einu landi til annars . Til dæmis ætti fyrirtæki að hanna forrit sín fyrir sérsniðið og staðbundið samhengi, þar með talið tungumál, mállýsku og kommur í raddbundnum forritum. Þannig færir app sama hátt á fágun raddupplifunar á hvert tungumál, frá ensku til tungumála undir fulltrúa.

Sanngirni og fjölbreytileiki

Að lokum tryggir hugaður AI lausnir byggðar á sanngjörnum og fjölbreyttum gagnasettum þar sem fylgst er með og áhrifum tiltekinna niðurstaðna áður en lausnin fer á markað. Með því að vera meðvituð og taka fólk með í öllum þáttum í þróun lausnarinnar, hjálpum við til við að tryggja að AI líkön haldist hrein, lágmarks hlutdræg og eins siðferðileg og mögulegt er.

Hvað finnst þér?

Þessi síða notar Akismet til að draga úr ruslpósti. Lærðu hvernig ummæli þín eru unnin.