Autore Topic: Dizionario spagnolo-italiano deagostini  (Letto 6197 volte)

Offline jhogol

  • Novizio
  • *
  • Post: 7
Dizionario spagnolo-italiano deagostini
« il: 10/11/13 15:31 »
Sperando di scrivere nella sezione giusta, ho comprato e convertito in formato stardict il dizionario deagostini spagnolo-->italiano
L'opposto, italiano-spagnolo è presente nel dizionario ma non l'ho ancora convertito in stardict ( e probabilmente mai lo farò). Se siete interessati a italiano-spagnolo vi posso dire come ho fatto.
Ho cercato di convertirlo al meglio che potevo, non sarà perfettissimo ma ci sono il 98% (percentuale ad occhio) de vocaboli dell'originale.

Non credo che violi alcunché condividerlo con chi ha comprato il suddetto dizionario in pdf, in quanto non è neanche protetto da DRM, quindi se lo volete scrivetemi un mp e vi farò una domandina per vedere se lo avete acquistato (costa 3€ suvvia)

Il dizionario è questo: http://www.ultimabooks.it/tutto-spagnolo

se qualche amministratore del forum crede che sia illegale una cosa del genere, chiedo già da subito scusa

Offline jhogol

  • Novizio
  • *
  • Post: 7
Re: Dizionario spagnolo-italiano deagostini
« Risposta #1 il: 19/01/14 19:16 »
Ho fatto una miniguida sul procedimento, difficilmente riproducibile (:D) con cui dal pdf ho ricavato i 3 file stardict.
Magari sarà utile a qualcun altro. Il punto più complicato il il comando sed. Come ho scritto, per quello mi sono fatto aiutare ;)

---

Passo 1 da pdf a txt
Se ti interessa solo italiano->spagnolo ti consiglio di dividere il pdf. Poi ho usato la versione di prova di nitro pro 9. Se ne trovi uno migliore buon per te, a me ha dato buoni risultati.
Così ottieni un file txt. Non ti preoccupare se è incasinato, poi lo aggiusti.

Da qui in poi si usa linux. Forse è ugualmente fattibile anche su windows, non saprei.
terminale, passo 1: converti il txt in txt LOL
dos2unix tuo_dizionario.txt
A questo punto ho dato:
sed -e '/[A-Z]$/d' -e '/^$/d' first_pages.txt|tr -e 's/ //' '\n' ' '  | sed -e 's/\./\.\n/g' -e 's/\ /\t/' -e 's/\-\ //g'

mi sono fatto aiutare LOL qui puoi trovare la spiegazione per aggiustarlo alle tue esigenze, ma dovrebbe funzionare così com'è: http://forums.debian.net/viewtopic.php?f=8&t=108925
Questo comando dovrebbe infatti aggiustare gran parte del dizionario.

A questo punto scaricati stardict-tools. E' il primo risultato di google. Va bene stardict versione 3.
Ci sarà il programma tabfile.
Qui c'è la guida ufficiale. http://www.stardict.org/HowToCreateDictionary
In pratica quando dai

tabfile dizionario.txt

ti darà numerosi errori. Di fianco all'errore c'è il numero di riga. Purtroppo uno a uno devi correggerli tutti.
Il file txt deve essere infatti:

vocaboloTABdefinizione del vocaboloACAPO

Il tab corrisponde al tasto di fianco alla q nella tastiera italiana. Devi togliere spazi inutili, lettere a caso, unire le frasi a capo, separare quelle unite...
Finalmente il tuo tabfile dovrebbe produrre 3 file.
Non ricordo se ora ti crea già i 3 file compressi o devi usare dictzip ma è opzionale, salva un po' di spazio.