Voici quelques tableaux, mais il reste un problème : quand le charset n'est pas en première position, file trouve "content text" et, évidemment, pas de traducteur. Les expressions régulières devraient permettre de résoudre le problème. Donc tableaux japonais...
Le but du Projet du 2e semestre est de traiter le corpus des fils RSS du journal Le Monde automatiquement. Pour cela, à partir d'un script perl fourni obligeamment par nos GP (Gentils Professeurs) qui permet de parcourir l'arborescence d'un corpus réduit...
Le but du Projet du 2e semestre est de traiter le corpus des fils RSS du journal Le Monde automatiquement. Pour cela, à partir d'un script perl fourni obligeamment par nos GP (Gentils Professeurs) qui permet de parcourir l'arborescence d'un corpus réduit...
Saturday, we tried to find and count the word "ecriture" in chinese with our pages aspirees, but...we had some problems: First, to count the chinese word with egrep -w and egrep -o, we have different results. With egrep -o "$motif" filename. --> we have...
Bonjour Je suis nouvelle camarade dans ce group. Je suis étudiante de INALCO. J'ai pris l'anglais, japonais dans l'universite de langue étrangére de Pékin. écriture (n.) (japonais) 1.さくぶん, しっぴつ, じ, 作文, 執筆, 字, 書体, 構成, 筆跡, 習字, 聖典, 著述業, 記載事項 2.文字。筆跡。また、書くこと。書き方。文章以外の映画・演劇・音楽などの表現法、書法の意味にも用いる。...
DOCUMENT STRUCTURE Aujourd'hui, nous nous sommes penchés sur le XPATH, c'est-à-dire le moyen de rechercher des infos dans un arbre XML. La syntaxe est simple : axe (following-sibling - vers la droite ; preceding-sibling - vers la gauche ; ou child - vers...
#!/bin/bash # avant de lancer ce script on se place dans le repertoire du projet # par exemple : # cd /Plurital mkdir PROJET-MOT-SUR-LE-WEB cd PROJET-MOT-SUR-LE-WEB # on peut desormais creer l'arborescence de travail mkdir ./CONTEXTES; mkdir ./DUMP-TEXT;...
A l'origine, je suis traductrice (anglais, allemand vers le français) et c'est en traduisant le seul livre de M. Chrichton (Oui, celui de Jurassic Park ou d'Urgences) qui n'a pas été un succès que je me suis mise à l'informatique et, plus exactement,...
sinon, le resultat de samedi! decoupage en 8 images car c'est long, le tableau. - tablo0812-2.png - tablo0812-3.png - tablo0812-4.png - tablo0812-5.png - tablo0812-6.png - tablo0812-7.png - tablo0812-8.png
Le Voilà, avec une petite image de fond de la Pierre de Rosette et ses liens. et le programme #!/bin/bash # script pour créer le tableau des liens #ne pas oublier de créer un fichier txt avec le nom et l'adresse des url et du futur tableau : input.txt...
Enfin, une fois que l'on a réussi à les installer ! Vive ppm, parce que CPAN on ne peut pas dire que c'est facile ! Merci S. Fleury ! Donc après installation des modules UNICODE::String, on peut appeler la fonction qw qui transforme le iso-8859-1 en gentil...
C'est, presque, réussi. Pour ne pas avoir à faire des couper coller à répétition, nous avons fait un hash contenant les rubriques : my %rubrique = ( "0,2-3208,1-0,0" => "ALAUNE", "0,2-3210,1-0,0" => "INTERNATIONAL", "0,2-3214,1-0,0" => "EUROPE", "0,2-3224,1-0,0"...
Voici la liste des encodages disponibles sur mon mac
Voici une autre version sur le Contexte anglais, cette fois à l'aide de Wordle (le précédent avec WordItOut). On distingue nettement moins bien les autres mots, mais c'est joli quand même.
Youpi ! Ça marche, enfin presque. Je ne comprends pas pourquoi mais quand je lui donne à manger le dossier 2008, le script fait tout très bien et pour le dossier 2012, il refuse obstinément de fermer le xml (bon je l'ai...
Après beaucoup d'hésitations, nous sommes tombées d'accord sur le mot "écriture". D'après le Robert : 6 sens. 1. Représentation de la parole par des signes : écriture idéographique, phonétique... 2. Type de caractères : gothique... 3. Manière dont on...
Notre Projet sur le mot écriture est maintenant terminé et vous pouvez lire le résultat sur le site en ligne http://www.tal.univ-paris3.fr/plurital//travaux-2012-2013/projets-2012-2013-S1/Jia-Li_Ching-Wen-Huang_Florence-Barberousse/SITE/index.html. Nous...
Voilà, le blog existe. Pour l´instant, il se sent bien seul et moi aussi. Il va falloir trouver un thème, un joli mot bien ambigu qui va pouvoir se décliner en hindi et en d´autres langues, avec quelqu'un d'autre, qui ne sera probablement pas de Nanterre,...
Petit nuage d'écriture.
voilà, un essai de nuage de mots pour un lien chinois avec Tagxedo; avec ceci, on a plus de choix sur la création de forme, de font, de couleur et de thème pour faire un joli nuage. Sinon, joyeux Noël et bonne année pour vous!
Le but de la prochaine BAO est d'étiquetter chaque mot (c'est-à-dire de lui accoler sa fonction : nom, déterminant, etc.). Pour les textes, c'est assez facile, il suffit de les convertir en iso latin (grâce à un iconv -f utf-8 -t iso-8859-1 SORTIETXT_ALAUNE.txt...
C'est mieux, mais il reste des choses étranges : le nombre d'occurences qui ne fonctionne pas à tous les coups, la jolie présentation de minigrep qui ne marche pas du tout. Mais ça s'améliore.
De l'importance du bon choix des quotes ! Là, ça marche ! Script perl qui aspire les pages. - fait_tab3.pl
Qui n'aspire pas. Voici un script en perl qui fait bien trois tableaux, avec un titre et une image différente. Mais qui refuse d'aspirer les pages en me disant "adresse mal formée". pourtant, quand je tape la même chose sur le terminal, il obéit très...