Project Gallu: Gwaith Adnabod Lleferydd Uwch

Diolch i nawdd Llywodraeth Cymru ac S4C, mae gan yr Uned Technolegau Iaith broject pellach i ymchwilio i dechnoleg adnabod lleferydd Cymraeg.

Bwriad project GALLU yw datblygu adnoddau datblygu lleferydd uwch  ar gyfer yr iaith Gymraeg. Gan adeiladu ar y project Adnabod Lleferydd Sylfaenol 2008-09, bydd y project hwn yn gwneud y canlynol:

  • casglu corpws lleferydd Cymraeg newydd trwy ddulliau torfoli, yn cynnwys nifer mawr o bobl amrywiol yn darllen yr un sgriptiau recordio (mae angen llawer o leisiau ac acenion gwahanol er mwyn gwella adnabod lleferydd)
  • creu ategyn canfod a chadarnhau iaith diofyn porwr ag gyfer y wefan torfoli
  • creu teipoleg cyweiriau iaith gyda metadata addas ar gorpws hyfforddedig wedi’i dagio yn ôl nodweddion cywair
  • datblygu sgript syml i reoli symudiad tegan robot ar gyfer y Raspberry Pi
  • datblygu system LVCSR ar gyfer y Gymraeg, gan greu system adnabod lleferydd Cymraeg cod agored o fewn Julius

Hoffech chi ein helpu?

Rydym yn chwilio am wirfoddolwyr i recordio’u lleisiau ar gyfer y corpws. Fydd dim rhaid i chi ddod i stiwdio, dim ond defnyddio’ch ffôn clyfar, tabled neu gyfrifiadur gyda meicroffon.

Rydym yn chwilio am bob math o leisiau: hen, canol oed, ifanc, cryf, gwan, de, canolbarth, gogledd, rhugl, dysgwyr, merched, dynion, plant…..

Byddwn yn betabrofi ein ap torfoli newydd yn Hacio’r Iaith ym Mangor, Chwefror 15. Os byddwch chi yno, dewch i’n gweld yno a rhowch UDID eich iPad i ni (ewch i http://whatsmyudid.com/ am gyfarwyddiadau ar sut i ddod o hyd iddo). Bydd fersiwn ar gael ar gyfer yr Android hefyd, ond nid oes angen UDID ar gyfer hwnnw.