20.1.2021

Videon tekstitys puheesta Screencast-O-Matic -sovelluksella

Ruudunkaappauskuva automaattisen 
teksityksen editointinäkymästä.
Olen viime kuukausina harjoitellut tekstittämistä Screencast-O-Matic-sovelluksella. Se on helppo käyttää ja useimmiten minulta kysytäänkin, kauanko tekstittäminen vie aikaa. Vastaan kysymykseen alla ja jaan muitakin kokemuksia. Varsinaiset ohjeet löydät sovelluksen sisältä (englanniksi) sekä alle upotetusta päivittyvästä diasarjasta Ruudunkaappausvideot ja tekstittäminen Screencast-O-Maticillä.

Screencast-O-Maticin voi maksutta ladata koneelle ilman admin-oikeuksia. Sovelluksella voi tallentaa jopa ilman kirjautumista max 15 min ruudunkaappausvideoita. Kirjautumalla saa lisäominaisuuksia ja maksullisella versiolla (alk. 1 $/kk, TAMK & TAU: kirjautumisohje intrassa) voi tekstittää tällä tai muulla sovelluksella tehdyn videon automaattisesti suomenkielisestä puheesta. Toki se vaatii editointia niin kieliasun kuin usein myös ajoituksen suhteen.

Ensimmäisen kokeilun tein Lasten lehtikone -videoon (6:14 min). Aloitin äänittämällä videon ja ryhdyin muokkaamaan tekstitystä. 20 min jälkeen päätin tehdä videon uudelleen yrittäen puhuta selkeämmin ja hitaammin, jotta korjattavaa jäisi vähemmän. Ajattelin, että jos video tuntuu liian hidastempoiselta, YouTubessa on mahdollisuus katsoa se nopeutettuna. Kaikkiaan tekstitysprosessi vein kaksi tuntia, mistä suuri osa kului siihen, kun selvittelin, miten saan videolta pois oheisessa kuvassakin näkyvät tyhjät kohdat, missä ei ollut tekstitettävää sisältöä, vaan vain joku huokaus ja muu napsahdus. Se onnistuu vain SRT-tiedostoa muokkaamalla, mistä kerron tarkemmin diasarjassani.

Olen aiemmin kokeillut automaattista puheen tekstitystä Applen Clips-sovelluksella sekä tekstittänyt yhden lyhyen YouTube-videon ja se onnistui todella helposti, mutta aikaahan sellainen vie. Screencast-o-Matic on minulle tuttu, mutta nyt käytin ensikertaa maksullista versiota, jossa opettelua vaati vain tekstitys. Siihen perusohjeeksi riittää sovelluksen oma tekstityksen ohjevideo (englanniksi, 1:58 min), joka esittelee kolme tekstittämisen tapaa: puheesta, tiedostosta tai videoon tekstinä lisäten. 


Kauanko puheesta luodun tekstityksen korjaus vie aikaa?

Sovellus kuin sovellus, ensimmäinen yritys sisältää aina opetteluaikaa ja toisen videon tekstittää jo nopeammin. Kun puheesta haluaa tekstittää, työtä helpottaa käsikirjoitus, selkeä ja rauhallinen puhe sekä lyhenteiden, erikoisten ja vieraskielisten sanojen välttäminen, vaikka sovellus niitä jonkin verran tunnistaakin. Esimerkiksi Kiipulassa digitutoreita kutsutaan digi-innostajiksi ja tästä oli videollani varsin monta eri versiota, mm. digin ostajat, innokkaat ja kiinnostavat. 

Paljonko tekstittämiseen menee aikaa, kun käyttää automaattista tekstitystä puheesta ja sitten korjaa sekä tekstityksen että ajoituksen? Paljon, ainakin kun ei ole ammattilainen ammattilaisen välinein. Prosessi eteni useimmiten seuraavasti: Katsoin videon kerran ja tein samalla korjaukset editoitinäkymässä. Sitten latasin tekstitykset SRT-tekstitystiedostona ja katsoin videon uudestaan korjaten kohdat, mitä ei editointinäkymässä voinut korjata. Sitten latasin tekstitykset takaisin videolle ja katsoin vielä kerran, pieniä muokkauksia tehden. Välillä jouduin muutamaan kertaan toistamaan edellä mainitun. 

  • Lasten lehtikone (6:14 min), tekstitys ja sen opettelu yli 2 h 
  • SharePoint Spaces eli tilat-työkalun esittely (2:25 min), tekstitys 23 min 
  • YouTube-kanavani esittelyvideo (1:45 min), tekstitys noin 20 min
  • Video H5P-työkaluista (11:24 min)
    • Mitä ovat H5P-työkalut? -video niin, ettei automaattista tekstitystä ole korjattu. Virheitä on paljon, sillä suomenkielisen puheen lomassa vilisee englanninkieliä sanoja ja lyhenne H5P tuottaa jatkuvasti ongelmia. 
    • Tekstityksen korjaus kesti ensin 65 min (SRT-tiedoston muokkaus) ja sitten vielä 45 min, kun esikatselin videon ja tein viimeiset korjaukset.
    • Tässä linkki korjattuun tekstitettyyn H5P-videoon.
  • Miten esitän Teamsissa dioja? (4:45 min), tekstitys 50 min 
  • Kiipulan Digi työtavaksi (5:03 min), tekstitys 30 min
  • Matleenan blogin esittely ja demo tekstityksestä (7:09 min), tekstitys 21 min (lue lisää alta)
  • Sukujuhlavideo (10 min), tekstitys 2:30 h (lue lisää alta)


Laadusta tinkimällä tekstityksen korjaus vie aikaa tuplasti videon keston 

Kokeilin tänään, miten nopeasti saan puheesta tehdyt tekstitykset korjattua, jos tingin laadusta ja teen korjaukset vain editointinäkymässä, mikä kyseisen videon tapauksessa riitti hyvin - mutta ei aina toimi. Matleenan blogin esittelyä ja demo tekstityksestä (7:09 min) -videon tekstittämisen korjaus kesti 21 min. Siinä ajassa kävin tekstitykset kertaalleen läpi editointinäkymässä. Korjasin virheelliset tekstit sekä isot ja pienet kirjaimet ja välimerkit, joissa sovellus ei ole taitava. Ajalliseen synkkaukseen en juuri puuttunut eikä puhe aina ole synkassa tekstityksen kanssa. Tekstityksessä asiat on välillä ilmaistu toisin, mutta sisältö ei muuttunut. Tekstitykseen jäi kirjoitusvirheitä, mutta moneen käyttöön tällainen on riittävän hyvä. Lopuksi latasin SRT-tiedoston ja vein sen sellaisenaan YouTubeen videon kanssa. 


Milloin aikaa menee paljon enemmän?

Tekstitin myös kaksi sukujuhlavideota ja ne nostivat esiin aivan toisenlaisia haasteita kuin puheeseen perustuvat videot. Tällaisen videon tekstitys oli huomattavasti hitaampaa. Yhden 10 min. videon tekstitys kesti 2:30 tuntia. Videoilla tekstitys oli tarpeen kahdesta syystä: tiedän katsojissa olevan huonokuuloisia ja toisaalta ääniraita on paikotellen todella huono eikä puhe kuulu selkeästi. Automaattinen tekstitys puheesta ei ollutkaan enää kovin hyvä idea, koska se ajoitti tallenteelle lukuisia kohtia, missä se luuli olevan puhetta, vaikka kyse oli monenlaisista taustaäänistä, joita arjessa syntyy ja parikymmenhenkinen sukulaisporukka monine lapsineen tuottaa. Automaattisesti luotuja tekstipaikkoja ei voi poistaa kuin SRT-tiedostosta. 

Tällainen video olisi todennäköisesti helpompi tekstittää kokonaan käsin. On outoa, että liian hiljaiseen kohtaan ei pysty lainkaan lisäämään tekstitystä editointinäkymän Sync Pointilla. Esimerkiksi videon hiljainen lapsen lauluesitys oli tekstitettävä SRT-tiedostoon kirjoittaen (siis ei vain tekstitys vaan myös ajoitus numeroin), vaikka juuri tällaisissa liian hiljaisissa kohdissa tekstitys on tarpeen. 

Videoilla oli myös paljon laulua. Se on puhetta hitaampaa, joten tekstityksen tempokin on hitaampi. Lisäksi Screencast-O-Matic jakaa tekstin harmillisesti pilkusta eri riveille, jolloin tulee kiusaus rikkoa kielioppia, jotta kokonaisuus olisi luontevampi. Esimerkiksi Keski-Suomen laulun tämän säkeen sovellus haluaa jakaa kolmelle riville: "ah, polut korpia kiertävät, kaidat".

Jos tekstityksen haluaa luoda kokonaan käsin SRT-tiedostona, tai muokkata sitä, se näyttää tällaiselta: 

53
0:05:11,400 --> 0:05:15,400
Minä olen vielä pikkuinen,

54
0:05:15,400 --> 0:05:19,400
ja siksi tahtoisin,

55
0:05:19,400 --> 0:05:26,400
oppia tän´maailman, paljon paremmin.


Mitä kysymyksiä jäi avoimeksi?

  • Paljonko on hyvä selkokielistää puhekieltä tekstityksessä? Hyvin kuulevia voi häiritä, jos puhe ja teksti eivät ole synkassa. Näin varsinkin YouTubessa, missä tekstitys pitää erikseen ottaa pois päältä. Toisaalta puhekielessä ajatus poukkoilee, joten lauseiden muotoileminen selkeämmiksi tukee saavutettavuutta. Tv-sarjojenkin tekstitys on usein tiiviimpää kuin puhe.
  • Kuinka tarkkaan tekstityksen on vastattava puhetta? Yhdellä videolla viittasin virheellisesti videon kommentteihin, kun tarkoitin videon kuvausta. Voinko tällaisen lapsuksen korjata tekstityksessä?  
  • Milloin YouTuben tekstitystyökalu on parempi? Uskoisin sen olevan parempi sukujuhlat-tyyppisille videoille, missä ei ole yhtä selkeää puheraitaa, vaan monenlaisia taustaääniä. Tosin omalla kohdalla haaste on, että perhevideoita en useinkaan voi tai halua YouTuben kautta jakaa.
  • Paljonko kannattaa nähdä vaivaa puheen ja tekstityksen yhtäaikaisuuden eteen?


Hyviä lähteitä videoiden tekstityksestä


Ei kommentteja:

Lähetä kommentti