PDA

Arkistonäkymässä ei tällä hetkellä lainaus erotu varsinaisesta viestistä. Suosittelemme että vilkaisette ns. täydellistä versiota: : Vanhat konekirjoituskirjoitukset tietokoneelle


Jemina
06.03.16, 17:23
Tuo OCR-ohjelma on kätevä kun joutuu muokkaamaan konekirjoitustekstiä Wordissä. Tekstisivu skannataan ensiksi ja siirretään OCR-ohjelmaan.

http://www.onlineocr.net/

ilkant
07.03.16, 01:21
OCR yleensäkin on hyvä juttu. Paljon paperilla olevia tekstejä on skannattu digitaaliseen muotoon. Mm. vanhoja sanomalehtiä. Digitaalisessa muodossa niistä voi hakea tekstejä hakusanoilla.

Jos vertaa tuota digitaalisessa muodossa hakemista omassa olohuoneessa olevalla tietokoneella siihen, että menisi maakunta-arkistoon lukemaan kymmeniä tai satoja sanomalehtiä etsiessään tietoa vaikkapa sukunimellä, niin...

Kun tekstejä muutetaan digitaaliseksi, ehkäpä seuraavat sukupolvet saavat tiedon paremmin hyödyksensä.

Julle
07.03.16, 10:46
< OCR yleensäkin on hyvä juttu. Paljon paperilla olevia tekstejä on skannattu digitaaliseen muotoon. Mm. vanhoja sanomalehtiä. Digitaalisessa muodossa niistä voi hakea tekstejä hakusanoilla.

Jos vertaa tuota digitaalisessa muodossa hakemista omassa olohuoneessa olevalla tietokoneella siihen, että menisi maakunta-arkistoon lukemaan kymmeniä tai satoja sanomalehtiä etsiessään tietoa vaikkapa sukunimellä, niin...

Kun tekstejä muutetaan digitaaliseksi, ehkäpä seuraavat sukupolvet saavat tiedon paremmin hyödyksensä. >

Samaa mieltä OCR on hyvä konekirjoituksen siirtämiseen digitaaliseen muotoon ja vielä sitten oikaisuluku tekstinkäsittelyohjelmalla lisäksi. Se lienee nykyisin jo pässin lihaa.

Mutta seuraava "tiikerin hyppy" lienee käsinkirjoitetun teksiin saaminen digitaaliseen muotoon tekstinkäsittelyohjelmalle. Olen muutamaa kokeillut AbbyyReader -ohjelmalla, mutta tulokset ovat olleet laihoja. Pitäisi opettaa käsinkirjoitetut kirjaimet erikseen, ennen kuin tulee edes oikaisuluettavaa tekstiä. Ja tietäähän sitä kaunokirjoitetun tekstin kirjasimet eri vuosisatoina ja eri pappien kirjoittamina. Siinä menee aikaa ja hermot!

Tutkimisiin

Topi
07.03.16, 12:37
< OCR yleensäkin on hyvä juttu. Paljon paperilla olevia tekstejä on skannattu digitaaliseen muotoon. Mm. vanhoja sanomalehtiä. Digitaalisessa muodossa niistä voi hakea tekstejä hakusanoilla.

Jos vertaa tuota digitaalisessa muodossa hakemista omassa olohuoneessa olevalla tietokoneella siihen, että menisi maakunta-arkistoon lukemaan kymmeniä tai satoja sanomalehtiä etsiessään tietoa vaikkapa sukunimellä, niin...

Kun tekstejä muutetaan digitaaliseksi, ehkäpä seuraavat sukupolvet saavat tiedon paremmin hyödyksensä. >

Samaa mieltä OCR on hyvä konekirjoituksen siirtämiseen digitaaliseen muotoon ja vielä sitten oikaisuluku tekstinkäsittelyohjelmalla lisäksi. Se lienee nykyisin jo pässin lihaa.

Mutta seuraava "tiikerin hyppy" lienee käsinkirjoitetun teksiin saaminen digitaaliseen muotoon tekstinkäsittelyohjelmalle. Olen muutamaa kokeillut AbbyyReader -ohjelmalla, mutta tulokset ovat olleet laihoja. Pitäisi opettaa käsinkirjoitetut kirjaimet erikseen, ennen kuin tulee edes oikaisuluettavaa tekstiä. Ja tietäähän sitä kaunokirjoitetun tekstin kirjasimet eri vuosisatoina ja eri pappien kirjoittamina. Siinä menee aikaa ja hermot!

Tutkimisiin

Tervehdys,

Oletko kokeillut tuollaisten vanhojen käsinkirjoitettujen tekstien lukua myös ?

Varsinainen kääntäminen taitaa olla "mission impossible" vielä tällä hetkellä mutta jos edes jonkin systeemille opetetun avainsanan haku onnistuisi ? Esimerkiksi meikäläisen olisi mukava saada lista osumista vaikkapa sanalle "kinnuin" Savon käräjäkirjoista... (niistä uudemmista joita ei vielä ole löydy hakukoneesta).

Terv
Topi Kinnunen

Jemina
08.03.16, 09:24
Mikähän ohjelma on sellainen johon voi lisätä fontteja ja ohjelma lukee ja korjaa lisättyä tekstiä. Löysin näitä fontteja Googlesta

https://www.google.fi/search?q=vanhat+kaunokirjoitus+aakkoset&biw=1536&bih=770&tbm=isch&tbo=u&source=univ&sa=X&ved=0ahUKEwj1jNiq_6_LAhVDYJoKHQInAyQQsAQIGw

Julle
08.03.16, 17:34
< Oletko kokeillut tuollaisten vanhojen käsinkirjoitettujen tekstien lukua myös ?

Varsinainen kääntäminen taitaa olla "mission impossible" vielä tällä hetkellä mutta jos edes jonkin systeemille opetetun avainsanan haku onnistuisi ? Esimerkiksi meikäläisen olisi mukava saada lista osumista vaikkapa sanalle "kinnuin" Savon käräjäkirjoista... (niistä uudemmista joita ei vielä ole löydy hakukoneesta). >

Hei!

Kyllä ABBYY FineReader 12 Professional lukee sujuvasti 190 kielellä skannatusta tekstistä, digikuvasta tai kuvistakin kaikkia standardoituja kirjaisimia erikoismerkkeineen ja jopa opettelee niitä tunnistamaankin. Minä kokeilin tosin vain suomen, ruotsin ja englanninmurteita. Ne voi sitten tarkastaa oikaisuluvulla Wordissa, niin löytyy pahimmat tulkintavirheet.

Kokeilin ihan vähän myös kaunokirjoituksen tulkintaa lisämodulilla, mutta hankalaksi meni. Se kyllä oppii opetetulla lukutavalla lisää ja osaa tunnistaa merkkejä ja merkkiyhdistelmiä, mutta rivien vaakasuoruus tuotti enemmän ongelmia, kun papit kirjoittaa miten sattuu tai skannaus ei olut tarkka. Kolmas ongelma oli vanhojen käsialojen tunnistus, kuten vuodet 1464, 1552, 1642, 1700, 1765 ja 1794 isoilla ja pienillä kirjaimilla. Itse pitäisi osata ensin paremmin. Eipä jaksa kerrata niitä enää Sampion Sepon Opi tutkimaan sukusi -kirjasta, vaan verraten vain.

Luovutin vielä, mutta ehkä tulevaisuudessa, kun aikaa on enemmän. Tarvetta luulisin olevan arkistolaitoksella, SSHY:llä ja SSS:lla.

Jeminankin kannattaisi kokeilla ilmaista ABBYY FineReader 6.0 Sprint. Se on kätevä, ainakin kätevämpi kuin OmniPage ja joku toinen. Paperista kätevästi suoraan Wordiksi ja oikaisuluku sitten ja talletus miksi vain haluaa, jos ei tarvitse käsitellä.

P.S. Tarkoitus ei ollut mainostaa mitään tuotemerkkiä, mutta kokemukset muista OCRistä ovat masentavia paitsi postin lähetyksen allekirjoituskuittauslaitteesta.

Tutkimisiin

Topi
08.03.16, 22:35
Tervehdys,

Mukava kuulla noista kokemuksista !

Olisihan se hienoa kun tuossa päätteellä kelaa vanhaa oikeudenpöytäkirjaa niin kone huomauttaisi että nyt löytyi joku kiinnostava nimi. Ihmeen hyvin tosin tuo ihmissilmäkin löytää osuman jos haettavia ei ole liian monta. Pitää vain "virittää" silmä sopivalle taajuudelle kuten suppilovahveroita etsittäessä !

Minulla on tuo Omnipage ollut jonkun vuoden ja ihan kohtuullisestihan sekin toimii mutta täytyypä kokeilla tuota mainitsemaasi ohjelmaa.

Terv
Topi

juhakari
27.05.16, 22:41
Genoksen uusimmassa numerossa 2/2016 on artikkeli
Maria Kallio: "Kohti käsinkirjoitetun tekstin automaattista tunnistusta".

Juha Kari

Jemina
28.05.16, 08:58
Kiitti tiedosta. Minulle ei tule Genos-lehteä ja en löytänyt netistä mistään, että voisin ostaa 2/2016 digilehden.

Miisamaija
28.05.16, 09:28
Tästä ohjelmasta Genoksessa kirjoitettiin. Sen voi ladata kotikoneelle. Transkribus: https://transkribus.eu/wikiFi/index.php/Etusivu
https://transkribus.eu/Transkribus/

juhakari
28.05.16, 10:56
Kiitti tiedosta. Minulle ei tule Genos-lehteä ja en löytänyt netistä mistään, että voisin ostaa 2/2016 digilehden.

Irtonumerotilaukset: tiedekirja*tsv.fi
12 euro per kpl.

Vuosikerta: seura *genealogia.fi

t. Juha

Jemina
28.05.16, 14:13
Joo mutta kirjoitus kiinnostaa minua juuri nyt. Lehden tulo kotiin kestää. Voiko joku skannata artikkelin ja lähettää sen minulle yksityisviestillä. Tilinumero ja summa mukaan niin maksan sen nettipankissa. Kiitti MiisaMaijalle latasin ohjelman koneelle muuten meni hyvin sain käsialakirjoituksen siirettyä ohjelmalle mutta en saanut sitä niinsanottua konekirjoitusmuotoon kun en tiedä millä toiminnolla se tapahtuu: Ohjelma on englannin kielinen

Juha
28.05.16, 14:22
Tekijänoikeussyistä en suosittele tuota, mutta sait jo linkin itse ohjelmaan ja tässä taustaa;

http://cordis.europa.eu/project/rcn/198756_en.html



Juha

Jemina
28.05.16, 14:36
No oletko itse tutustunut Transkribus-ohjelmaan. Voisitko neuvoa, miten käsialatesti muutetaan tavalliseksi tekstiksi ohjelmassa,

Juha
28.05.16, 14:37
En ole.

Jos asia kiinnostaa kovin niin tilaa tuo lehti tai tutustu annettuihin linkkeihin

Googlettamalla löytynee lisää tietoa



Juha

Miisamaija
28.05.16, 14:41
Hei Jemina,
en ole myöskään tutustunut vielä ohjelmaan, enkä sitä nyt voi tehdä, mutta auttaisiko Google kääntäjä? https://translate.google.se/?hl=fi&tab=wT

Jemina
28.05.16, 15:18
Kiitti sinulle linkistä: mieheni Jorma otti ohjelman pois meidän yhteiseltä pöytäkoneelta, Minä käytän Exploderia ja Jorma käyttää Mozillaa. Ohjelman lataamiseen tarvitsee olla Java-ohjelma ja Jorman mielestä se saastuttaa tietokoneen ja poisti sen. Koko Transkribus-ohjelma poistui samalla.

Julle
29.05.16, 10:35
< No oletko itse tutustunut Transkribus-ohjelmaan. Voisitko neuvoa, miten käsialatesti muutetaan tavalliseksi tekstiksi ohjelmassa >

No enpä minäkään, mutta kahdeksan vuotta sitten olin testikaniinina nykyisen Postin käyttämässä allekirjoituksen tunnistavan ohjelman testauksessa. Onpa tullut muutaman kerran kuitattuakin paikallisessa postissa lähetys vastaanotetuksi, joten muutaman vuoden kesti senkin tuotantokuntoon saattaminen.

Kyllä nuo nykyisetkin tekstintunnistusohjelmat tunnistavat kuvasta tekstin, mutta kaunokirjoitettu on hieman hankalaa, saatikka sitten eri käsialojen.

Odottelemisiin ja kärsivällisyyttä - aika näyttää