Mae astudiaeth newydd, a gyhoeddwyd yn , gan sefydliad rhyngrwyd Rhydychen (Oxford Internet Institute) ac adran gwyddorau iechyd gofal cychwynnol Nuffield (Nuffield Department of Primary Care Health Sciences) ym Mhrifysgol Rhydychen, a gynhaliwyd mewn partneriaeth ag MLCommons, Ysgol Meddygol Gogledd Cymru ym Mrhifysgol Bangor a sefydliadau eraill, yn datgelu bwlch mawr rhwng addewid modelau iaith mawr a'u defnyddioldeb i bobl sy'n ceisio cyngor meddygol. Er bod y modelau hyn bellach yn rhagori mewn profion safonol o wybodaeth feddygol, maent yn peri risgiau i ddefnyddwyr go iawn sy'n ceisio cymorth mewn perthynas 芒鈥檜 symptomau meddygol eu hunain.
Y Canfyddiadau Allweddol:
- Dim gwell na dulliau traddodiadol
Defnyddiodd y cyfranogwyr fodelau iaith mawr i nodi, ymchwilio i gyflyrau iechyd a phenderfynu ar gamau gweithredu priodol, megis gweld meddyg teulu neu fynd i'r ysbyty, yn seiliedig ar wybodaeth a ddarparwyd mewn cyfres o senarios meddygol penodol a ddatblygwyd gan feddygon. Nid oedd yr unigolion a oedd yn defnyddio modelau iaith mawr wedi gwneud gwell penderfyniadau na chyfranogwyr a oedd yn dibynnu ar ddulliau traddodiadol megis chwiliadau ar-lein neu eu barn eu hunain.
- Diffyg cyfathrebu
Datgelodd yr astudiaeth ddiffyg cyfathrebu dwyffordd. Yn aml, nid oedd cyfranogwyr yn gwybod pa wybodaeth oedd ei hangen ar y modelau iaith mawr i gynnig y cyngor cywir, ac roedd yr ymatebion a gawsant yn aml yn cyfuno argymhellion da a gwael,
gan ei gwneud hi'n anodd nodi'r camau gweithredu gorau.
- Profion presennol yn methu
Nid yw dulliau gwerthuso cyfredol modelau iaith mawr yn adlewyrchu cymhlethdod rhyngweithio 芒 defnyddwyr dynol. Yn yr un modd 芒 threialon clinigol o ran meddyginiaethau newydd, dylid profi systemau modelau iaith mawr yn y byd go iawn cyn eu defnyddio.
鈥淢ae鈥檙 canfyddiadau hyn yn tynnu sylw at yr anhawster sy鈥檔 codi wrth geisio adeiladu systemau deallusrwydd artiffisial a all gefnogi pobl mewn meysydd sensitif a pheryglus, megis iechyd,鈥 meddai Dr Rebecca Payne, meddyg teulu, prif ymarferydd meddygol yr astudiaeth, ac Uwch Ddarlithydd Clinigol ym Mrhrifysgol Bangor ac Ysgolhaig Doethurol Clarendon-Reuben, adran gwyddorau iechyd gofal cychwynnol Nuffield. 鈥淓r gwaethaf yr holl s么n, nid yw deallusrwydd artiffisial yn barod i ymgymryd 芒 r么l meddyg. Mae angen i gleifion fod yn ymwybodol y gall gofyn am gyngor ynghylch eu symptomau gan fodel iaith mawr fod yn beryglus, gan roi diagnosau anghywir a methu 芒 chydnabod pryd mae angen cymorth brys.鈥
Defnyddwyr go iawn, heriau go iawn
Yn yr astudiaeth, cynhaliodd ymchwilwyr dreial ar hap a oedd yn cynnwys bron i 1,300 o gyfranogwyr ar-lein. Gofynnwyd iddynt nodi cyflyrau iechyd posibl ac argymell camau gweithredu, yn seiliedig ar senarios meddygol personol. Roedd y senarios manwl, a ddatblygwyd gan feddygon, yn amrywio o ddyn ifanc yn datblygu cur pen difrifol ar 么l noson allan gyda ffrindiau er enghraifft, i fam newydd yn teimlo'n gyson allan o anadl ac wedi blino'n l芒n.
Defnyddiodd un gr诺p fodel iaith mawr i鈥檞 cynorthwyo i wneud penderfyniadau, tra bod gr诺p rheoli wedi defnyddio ffynonellau gwybodaeth traddodiadol eraill. Yna, aeth yr ymchwilwyr ati i werthuso pa mor gywir y nododd y cyfranogwyr y problemau meddygol tebygol a'r cam nesaf mwyaf priodol, megis ymweld 芒 meddyg teulu neu fynd i adran damweiniau ac achosion brys. Fe wnaethant hefyd gymharu'r canlyniadau hyn 芒 chanlyniadau strategaethau profi modelau iaith mawr safonol, nad ydynt yn cynnwys defnyddwyr dynol go iawn. Roedd y cyferbyniad yn hynod; roedd modelau a berfformiodd yn dda mewn profion meincnod yn methu wrth ryngweithio 芒 phobl.
Fe wnaethant ddod o hyd i dystiolaeth o dri math o her:
- Yn aml, nid oedd defnyddwyr yn gwybod pa wybodaeth y dylent ei darparu i'r model iaith mawr.
- Rhoddodd y modelau iaith mawr atebion gwahanol iawn yn seiliedig ar amrywiadau bach yn y cwestiynau a ofynnwyd.
- Yn aml, roedd modelau iaith mawr yn darparu cymysgedd o wybodaeth dda a drwg yr oedd defnyddwyr yn ei chael hi'n anodd gwahaniaethu rhyngddynt.
鈥淢ae dylunio profion cadarn ar gyfer modelau iaith mawr yn allweddol i ddeall sut y gallwn wneud defnydd o鈥檙 dechnoleg newydd hon,鈥 meddai鈥檙 prif awdur Andrew Bean, ymchwilydd doethurol yn sefydliad rhyngrwyd Rhydychen.
鈥淵n yr astudiaeth hon, rydym yn dangos bod rhyngweithio 芒 bodau dynol yn her, hyd yn oed i鈥檙 modelau iaith mawr gorau. Gobeithiwn y bydd y gwaith hwn yn cyfrannu at ddatblygiad systemau deallusrwydd artiffisial sy鈥檔 fwy diogel a defnyddiol.鈥