Tag Archive: ubuntu


Cours du 2 novembre (suite)

Par Samantha -prise de notes en live

Première étape : script mot

cf : cours en ligne http://www.tal.univ-paris3.fr/cours/PROJETMOTSURLEWEB

Ecrire une programme pour récuperer les urls les mettre dans un tableau avec une numérotation.

Pour ce faire, on image que notre fichier d’url est un ensemble : pour chaque url x appartenant  au fichier d’url je veux qu’il apparaissent dans une ligne du tableau.

for x in X {

Il faut trouver un moyen pour pouvoir considérer notre fichier url comme un ensemble, pour pouvoir considère chaque élément de l’ensemble.

Astuce : Lorsqu’on fait un cat d’un fichier, le terminal affiche la liste des ligne du fichier. Il affichera la liste des url du fichier. Utiliser un cat du fichier permettra d’afficher à l’écran l’ensemble des url du fichier. Le retoure à la ligne va être le segmenteur et on pouvoir obtenir virtuellement un ensemble d’urls.

Pour la constitution de l’ensemble des urls on va récupérer le résultat d’une commande à la fenetre de commande. comme ensemble résultat de la boucle for on récupère le résultat de cat en utilisant « l’inverted quote’

for (x) in ‘cat $fic’

Read fic : le bash attend qu’on lui donne qqchse au clavier pour l’introduire dans la variable fic. Lorsqu’on veut invoquer la valeur du contenu de la variable, il faut le $.

si on écrit x= »url.txt »

echo $x on a url.txt

Si on veut afficher le contenu de la variable il faut utiliser le $

x= »serge »

echo « bonjour $x »

résultat : Bonjour serge

la variable garde la même valeur tant qu’on a pas changer son contenu par une affectation. Dès qu’on change son contenu la variable change.

Autre façon de faire des affectations :

read : affectation d’un valeur à une variable ( juste le nom pas le contenu)

fic : bien qu’il contienne le nom du fichier avec le chemin relatif, cela ne veut pas dire qu’il contient les chaine de caractères du fichier lui même. On donne à fic juste une valeur qui est une chaine de caractères.

read fic si on rentre url.txt si on fait echo $ fic ( permet d’accéder à la valeur de la variable)on nous donne url.txt

cat $fic : affiche le contenu du fichier fic qui est la variable. On va donc obtenir tout le conteu du fichier url.txt

les quotes inversés :`  `

on dit au shell d’exécuter la commande et de ramenr le résultat dans le ctxt de l’autre commande que l’on fait. signification : exécuter la commande et afficher son contenu.

CF. Doc : Premiers Scripts tableau de lien

Une boucle for pour indiquer à la machine d’aller elle même à chaque ligne d’url.

for nom in `cat $fic`

résultat : http://www.html

http://……

{

echo « <tr><td> $nom</tr></td>

}

for fait une affectation à nom

après les accolades la boucle for ferme les balises. sur Ubuntu les accolades sont remplacée par do et done

Créer un script capable de prendre en entrée tous les fichiers urls, à lancer une seule fois

Par Samantha – prise de note en live

La balise <meta>;

très importante à renseigner. Lorsqu’on écrit la page, il faut enregistrer le document écrit sous notepade++ il faut l’enregistrer en UTF-8 et préciser dans la balise meta « content » UTF-8.

Lorsqu’on écrit une page dans quel encodage est-on ?

Utiliser la commande FILE

file(espace) -i nom du fichier : cette commande nous donne en quel charset on a écrit.

Toujours se demander dans quel encodage on écrit et comment le repérer.

Il y a une commande qui permet de convertir un encodage dans un autre : iconv

Ce n’est pas parce qu’on dit UTF-8 dans la balise méta que l’on est dans un encodage UTF-8

TOUT CE QUI DEVRA ETRE GENERE DEVRA ETRE CODE EN UTF-8 !

Commande Unix qui permet de savoir dans quel encodage on est  et aussi la localisation: locale

Schéma représentant la chaîne de traitement :

EXPLICATION :

extraction des URL : si la page est en UTF-8 on pourra extraire la page en utilisant la commande lynx.

si la page de l’url n’est pas codée en UTF-8 : il faudra trouver dans quel code est faite la page, la changer en UTF-8.

Bloucle : for > pour chaque éléments du tableau passage par l’encodage et traitement.

Un traitement supplémentaire pour compter les mots de la page de chaque url.

Le traitement doit être capable de construire des tableaux de tel sorte que pour chaque url le lien pointe vers la page, et montre quelle est son encodage.

Cours d’introduction au système d’exploitation Unix

Pour plus de détails se reporter au cours d’introduction à Unix sur i-campus, la plateforme de cours en ligne de l’Université Sorbonne Nouvelle Paris III.
N.B. : les notes ci-dessous sont mes notes de cours et ne reflètent que la compréhension que j’ai de ceux-ci, merci de me signaler toute erreur ou omission de ma part.

Quelques définitions :

Système d’exploitation (OS) : c’est un programme composé d’un ensemble de logiciels qui nous permet, grâce à ses fonctionnalités d’utiliser notre machine. Il existe plusieurs systèmes d’exploitation. Le plus connu du grand public c’est Windows dans toutes ses versions ( XP, Vista, 7,etc.). Il existe aussi deux autres grandes familles de systèmes d’exploitation connues : Macintosh d’Apple ( Mac OSX, OSX Lion, etc.), et Unix et ses bébés Linux, Ubuntu, Kubuntu, etc.

Nous allons travailler sous un système d’exploitation de la famille d’Unix : Ubuntu. C’est pourquoi ce cours s’intitule Introduction à Unix.

Unité centrale : c’est le cerveau de la machine. Il est constitué de plusieurs composantes ayant chacune leur fonctions. On distingue : – le disque dur , celui-ci permet le stockage et l’organisation  des fichiers. cet espace de stockage se présente sous forme arborescente dont le point de départ s’appelle la racine. Sous Windows C: ou D:, . Sous Unix, a racine est unique est ne se voit. il y a un seul noeud racine représenté par /.                                                                                                                   – la RAM  ou mémoire vive : c’est là que sont stockées toutes les données non sauvegardées. C’est cette composante qui est responsable des différence de prix d’une machine à l’autre.                                                                                                                          – le processeur et la carte graphique.

Répertoire : un répertoire et un conteneur. Il peut contenir d’autres répertoires et des fichier. C’est une position dans l’arbre.

Fichier : il contient une information d’une quelconque nature.

Pour faire de la programmation il faut ouvrir le Terminal (Applications>Accessoires>Terminal). C’est une fenêtre noire à travers laquelle on va naviguer, donner des ordres, créer, effacer, organiser, notre travail sous Ubuntu.

Pour ce faire il faut connaître un certain nombre de commandes.

Dans l’article suivant, vous aurez un aperçu des fonctionnalités et un descriptifs de quelques commandes d’usage fréquent sous Ubuntu.

Sam

Multilinguisme

Sentiment Analysis

Infographie

Réseaux sociaux

  • L’AFP publie un guide de participation de ses journalistes aux réseaux sociaux (PDF)  http://t.co/xPWbo3Pt

IBM top features on developerWorks this week:

En vrac

Introduction à Unix :

 

à compléter