Génération d'Arbres Arborés v2.2



Démo en ligne du logiciel (v2.1): https://82.231.26.242/cgi-bin/ArbreArbore.cgi
Ne marche que quand mon serveur est actif

Description :

ArbreArbore, est un logiciel de création de nuage arborés a partir d'un texte.
Le programme est entièrement fait en C pour la version 2.
Détails sur la fabrication d'arbres : TreeCloud
 http://www.lirmm.fr/~gambette/ProgTreeCloud.php

Téléchargement :
ArbreArbore_2.2 (Binaire Unix - i386 seul ~25ko compressé UPX)
ArbreArbore_2.2.exe (Binaire Windows seul ~42ko compressé UPX)
ArbreArbore_2.2_Source.zip ( Sources ~36ko)

Les scripts CGI/Python sont aussi disponibles séparemment dans le dossier ci dessous.
Pour les anciens fichiers voir ici : DOWNLOAD
Licence GPL

Ligne de commande du logiciel :


Mode verbeux : -v
(permet de voir vraiment toutes les étapes de la fabrication du dessin)
IN:
Nom du fichier d'entrée : -file %s
Nom du fichier AntiDico : -fileantidico %s
Taille de la fenêtre : -taillefenetre %d
Nombre maximum de mots à garder : -nombremaxmots %d
 ou nombre minimum de mots a garder : -nombreminmots %d
Pour le Graphique (Format SVG) :
hauteur : -image_width %d
largeur : -image_height %d
Type de calcul des distances : -typedistance %s
%s in (chisquared,mi,liddell,dice,jaccard,gmean,hyperlex,ms,oddsratio,zscore)
      (loglikelihood,poissonstirling,google)
OUT:
Nom du fichier du texte traité, un mot par ligne : -fileout %s
Nom du fichier des Fréquences (CSV : mot;frequence\n) : -filefrequence %s
Nom des fichiers de matrices des distances (O11..O22): -fileCSV %s
 %s est ici juste le préfixe des matrices par exemple -fileCSV O produira :
 O11.csv,O12.csv,O21.csv,O22.csv
Nom du fichier des distances (format CSV) : -filedistance %s
Nom du fichier .nexus : -filenexus %s
Nom du fichier du Graph (Format Newick) : -filenewick %s
Nom du fichier du Graph (Image SVG) : -filegraph %s

Compilation :

Testé avec GCC 4.4.1 et GCC 3.4.4

make all
make install
make uninstall
make clean

Historique :

v2.2 (01/2010)
Algo de placement des étiquettes amélioré
Révision de la source, séparation des fonctions dans des fichiers différents, .h fabriqués pour une meilleur compréhention

v2.1 (01/2010)
Algo de placement des étiquettes
Algo BioNJ pour la génération de l'arbre
Algo EqualAngles corrigé

v2.0 (01/2010)
Projet entièrement refais en C
correction de pas mal d'erreurs
makefile plus correct
possibilité de choisir entre garder au max X mots ou au minimum X mots

v1.1 (04/2009)
Projet renommé en ArbreArbore
Licence GPL
algorithme UPGMA abandonné, maintenant basé sur l'algo. Neighbor-joining
Sortie graphique SVG améliorée (avec infobulle, possibilité de déplacer les labels)
Script python : rajout d'antidico perso.

v1.0 (03/2009)
première version pleinement fonctionnelle :
génération de fichier .nexus, .newick (algo UPGMA)
calcul des distances selon plusieurs méthodes
(voir http://www.lirmm.fr/~gambette/ProgTreeCloud.php)
Sortie graphique Format SVG (compatible FireFox)
Script python démo d'utilisation en ligne (web)

v0.9
(pas eu le temps de mettre à jour)

v0.8 (03/2009)
Traduction de la librairie et du programme pour le compilateur Nasm
Passage par la LibC et non plus directement les Api Windows donc compatible UNIX désormais.
-Reste à traduire la génération du fichier Nexus
-Implémentation de diverses manière de calculer les cooccurrences finales à venir.

v0.7 (12/2008)
Implémentation de la distance de Jaccard et génération de fichier .nexus

v0.6 (12/2008)
Changement d'algorithme de calcul des cooccurrences en O(min(m,w)^2*t)

v0.5 (12/2008)
Amélioration de l'algorithme de conversion matrice en ram > CSV
Amélioration sensible de l'algorithme de calcul des cooccurrences O(m^2*t*w) dans le pire des cas et O(m^2*t) dans le meilleur.

v0.4 (12/2008)
Correction d'un bug dans la gestion de la fenêtre
Correction d'un bug dans le calcul des performances (niveau du temps)
Ajout de possibilités dans la ligne de commande
Ajout de l'affichage des mots / fréquences gardées

v0.3 (12/2008)
Utilisation des arbres, distance minimum entre les mots plus utilisée
Création de la matrice des Cooccurrences en 4 fichiers CSV
Affichage des performances en temps
Sélection possible de la fenêtre entre 20,30,40,50
et du nombre de mots entre 10,15,20,50
Plus de génération de fichier nexus

v0.2 (12/2008)
Ajout de la classe ArbreDico (qui permet d'avoir un dico trié)
Cette classe permet l'accélération du traitement de l'AntiDico.
Rajout de l'affichage des performances de chaque étapes du calcul.
Correction d'un bug dans la génération du fichier nexus

v0.1 (12/2008)
Classes Dico, DicoTexte
Calcul de la somme des distances mini entre les mots / fréquence cumulée des 2 mots * 2^16 (décalage de 16bits pour une précision de 2 octects de plus)


Contact :
poulphunter@yahoo.fr