Kamelot Blog

Aller au contenu | Aller au menu | Aller à la recherche

samedi 4 septembre 2010

sam
04
sep '10

Sphinx : j'en dit un peu plus sur ce moteur de recherche

Je parlais il y a 2 jours de sphinx en expédiant une explication en 2 secondes.

Le lendemain, je vois sur Planet Mysql que Shlomi Noach publiait un article pour remettre les pendules à l'heure sur ce qu'est sphinx

Je vais donc en dire un peu plus.

Sphinx est un moteur d'indexation/recherche open-source sous GPLv2.

On utilise indexer pour scanner ce qu'il faut indexer, cela génère des fichiers que searchd rend consultables.

Pour attaquer searchd, on a search en ligne de commande.

Mais on a aussi

  • SphinxSE: un engine mysql, il sera inclus directement dans les prochaines versions de mariaDb
  • SphinxAPI: que l'on peut utiliser en php avec un package pecl dedié mais aussi avec les apis officielles Php, Python, Java, Ruby, pur C, fournies avec sphinx, ou bien encore Riddle pour Ruby, Sphinx::Search pour perl, C++ Sphinx client, Haskell Sphinx client, C# .NET client, ...
  • SphinxQL: une syntaxe sql adaptée

Recherche

Pour la recherche elle même on a les syntaxes avancées sur le texte ...

  • et, ou , mais pas,
"hello world" @title "example program"~5 @body python -(php|perl) @* code
  • les quorum (je donne 7 mots et je veux qu'il y en aie au moins 4 dans chaque résultats)
  • la pertinence (ce mot là a plus de poids dans le titre, celui ci partout, ... )
  • la distance dans le texte : ces 2 mots là doivent être séparés par moins de n mots
  • Des remplacements
    • de caractères pour les problèmes de charset
    • les remplacements magiques (si je cherche email, je trouve aussi les contenus avec le mot courriel) sur base de vos listes (voir exemple en bas)
    • Morphologie linguistique, stemming (gestion des pluriels),
    • listes de mots interdits
    • listes de dictionnaires personnels pour la correction magique
  • ...

.. Les critères de filtre et tri annexe

  • groupes (avec decompte par groupe)
  • temporels
  • géographiques
  • ...

J'en passe bien sur.

Le service searchd est consultable via réseau (donc si vous utilisez SphinxSE il n'est pas embarqué dans la DB il peut/ils peuvent être ailleurs) avec ssl et tout le brol.

Indexation

La première chose à distinguer c'est qu'il n'est pas limité à mysql ni même à des bases de données. On peut indexer tout ce qui peut être parsé, moyennant une conversion vers un fichier xml.

On peut indexer des sources hétérogènes les mélanger comme on peut indexer partiellement une source monolithique.

On peut indexer "sur le coté" pendant que l'index précédent reste actif et swapper à la fin (très difficile à faire : il faut ajouter un --rotate)

On peut indexer par petit morceaux et exploiter les partitions ou les merger

On peut répartir les indexs sur plusieurs serveurs

Brefs il y a moyen de distribuer la recherche et l'indexation.

Il y a des techniques de RealTime indexing mais c'est dans la 1.10-beta

Lire la suite...

samedi 8 décembre 2007

sam
08
dec '07

Claroline present et futur

La présentation de Seb et Mla aux Claroline users day
SlideShare | Voir

samedi 10 novembre 2007

sam
10
nov '07

World Usability Day : le feedback

A voir : Les videos de Arnaud Grégoire (Katch'a!)

Avec Mathieu et Sebastien (de Claroline), je suis allé au World Usability Day, organise par (entre autres) Hugues, mon ancien collègue de l'UCL. (papa du nom "claroline" justement).

A l'entrée nous avons ete accueilli par Baptiste Campion et Anne-Sophie Collard (de l'UCL), comme sur la première vidéo et Hugues Peeters (Emakina). Sur la vidéo c'est Ploum (Mister Ubuntu Belgique) et son acolyte Benjamin du louvainLinux qui sont accueilli par Baptiste, Anne-Sophie, et Pierre Fastrez (UCL et chef d'orchestre de cette soirée).

Entrée dans la salle, exploration des visages connus : au pif une dizaine d'Emakina dont vinch, d'autres blogueurs dont ploum, Michael Villar, xMonkeyMosherx, Madame Monique Mozilla Brunel, des têtes UCL et 5 Skynet. J'étais vraiment agréablement surpris par la présence de ces 5 collègues. Ca fait du bien de voir concrètement que la problématique d'usabilite et ce qui va avec : ergonomie, simplicité, l'accessibilité, efficacité,... ) est prise en considération dans la boite ou l'on travaille. En effet ce sont des notions qui passent (beaucoup) trop souvent en second plan des préoccupations de nos (je ne parle pas de skynet) responsables.

J'ai oublie mes notes au boulot, je compléterai donc ce post lundi.

  • La première présentation de Sacha Kocovski qui nous a montre comment il a travaille en prenant en exemple l'évaluation de deux sites web des hôpitaux Erasme et Brugmann par l'utilisation de tests utilisateur. Il nous a montre des questions types, des façons de faire, quelques définitions.
  • David Geerts(KUL), a présenté "personas 2.0". Si j'ai bien compris cette présentation en anglais, c'est la création dans un premier temps d'un personnage virtuel ayant une présence réelle sur le web, avec une vie sociale, un caractère,... qui représente l'utilisateur type de mon application. Et ensuite une déclinaison matérialise de cet utilisateur sous diverses formes : un poster, une postiche, un mug, ... pour que tous les acteur du développement de l'application puissent recentrer sans cesse leur travail sur cet utilisateur type.
  • Jean-Marc Hardy a fait la présentation qui aura apparemment le plus plu, et j'en suis. Il est parti des critères de Scapin et Bastien mais pour les contenu au lieu du contenant.
  • Jean Vanderdonckt nous montre pour la 4eme présentation, 2 cas dans le thème officiel de cette année : "les services de santé".

On le voit sur la 2eme vidéo. Une application inter-hôpitaux pour l'échange d'information d'un patient en cas d'urgence. L'autre cas présentant l'intégration de l'informatique dans la vie d'un service d'urgence répartissant les interactions avec PC pocket, PC normal et écran digital géant.

En tout cas ce que j'ai retenu :

  1. ° les principes émis par Bastien et Scapin semblent faire l'unanimité (et ils ont été scientifiquement valides)
  2. ° Une moyenne de 40 problèmes d'ergonomie dans une application.
  3. ° Les réparer pendant le développement parce qu'on ne les a pas remarque pendant la conception, peut coûter jusqu'à 30x plus cher
  4. ° Les réparer sur une appli en production parce qu'on ne les a pas remarque pendant la conception ou le développement, peut coûter jusqu'à 100x plus cher. (sans compter le désagrément porte a l'utilisateur quand un changement sera fait.
  5. ° Changer une appli, même pour du mieux ca perturbe l'utilisateur (parfois plus que l'amélioration apportée). Ca je l'ai bien vécu chez iCampus.
  6. ° Un lien doit ressembler a un tiroir transparent
  7. ° une icône n'est pas animée.

... prochaine étape (mais sans moi :( ... Paris web

Je pense vraiment qu'il est intéressant de lire aussi les autres :

vendredi 9 novembre 2007

ven
09
nov '07

World Usability Day

Je viens de rentrer du World Usability Day de Louvain-la-Neuve. Je suis naze. Donc feedback demain :)

J'envoye juste les photos sur flickr Pierre Fastrez

samedi 17 mars 2007

sam
17
mar '07

Free & Open Source in Europe, Perrick Penet

Free & Open Source in Europe par Perrick Penet de No Parking à la PHP Conference de Vancouver en 2007

jeudi 14 décembre 2006

jeu
14
dec '06

Présentation de Claroline à Mons

L'équipe de choc de "communication" sur claroline faisait halte à Mons à la HERB, dans les locaux ou l'hébergeur de ce blog a fait son graduat.[1] Moi je n'y ai fait qu'un an. Mais 3 ans de secondaire.

Notes

[1] mais il est tellement vieux qu'à l'époque ca s'appelait IRAM

Lire la suite...

mardi 5 décembre 2006

mar
05
dec '06

Cécile Debacker

Cécile, initialement connue sous le nom de Cigogne du temps où je courrais en short dans le chateau Courrière. Depuis c'est devenu ma femme.

Lire la suite...

mercredi 22 novembre 2006

mer
22
nov '06

Support et résumés du Forum PHP Paris 2006 sont disponibles

Les supports de présentation du Forum PHP Paris 2006 organisé par l'AFUP sont là.

neXen en parle et Jean-Marc Fontaine en parle aussi

lundi 13 novembre 2006

lun
13
nov '06

L'équipe claroline toute attentive, pendant le forum

L'équipe claroline

samedi 11 novembre 2006

sam
11
nov '06

Les photos du forum PHP

ForumPHP2006 le tag du forum PHP

Pour flickr ForumPHP2006 est le tag du forum. Mais on trouve celles qui ne sont pas encore taguées ici

Les photos de Damien sont ici Nous en avons pris 400 photos, elle arriveront sur flickr pendans la semaine prochaine.

vendredi 10 novembre 2006

ven
10
nov '06

PHP Forum 2006

On les a retrouvé !!!
ven
10
nov '06

Jour 2 - Présentation 4 : Damien, ange de la sécurité.

Une petite présentation sur toutes les partiques qui mènent à ouvrir quelques fonctionnalités aux rares malveillants qui fréquentent notre beau web. La sécurité, ca se vit déjà tous les jours, alors pourquoi se donner plus de travail, alors qu'une série de bonnes pratiques permettent de s'éviter pas mal de problèmes.

Généralement quand un ordinateur fait quelque chose pour vous, pour vous faciliter la vie de gestionnaire ou codeur ou administrateur, alors il aura probablement aidé aussi les malveillants.

Il y a souvent des articles sur le sujet dans direction PHP mais aller voir les slides pour continuer cela

Damien Seguy nous a décliné cela.


PHP2006 sécurité des appli PHP
envoyé par afup
ven
10
nov '06

Jour 2 - Présentation 2 et 3 .... allez voir ailleurs :(

Un petit (énorme) soucis technique au boulot m'a retenu hors de la salle de conférence.

J'ai donc loupé 2 des plus prometeuses présentation.

Je tenterai de linker ici d'autres feedbacks....

Gérald mister Copix, a présenté les Design pattern que je voudrais utiliser un peu plus dans Claroline.

ven
10
nov '06

Jour 2 - Présentation 1 : eZ Component by king Derick

Présentation en anglais. eZ Component, dont on avait pu lire une bonne description dans un direction php du début de cette année, nous est présenté par Derick. Un framework de plus ? oui, comme Pear que j'aime bien ou zend platform.

Le but des component de eZ est de fournir au public des briques génériques qu'ils utilisent pour ez Publish.

Cela permet d'élargir leur champs de test.

Voici ses slides et son feedback

jeudi 9 novembre 2006

jeu
09
nov '06

Jour 1 - Présentation 7 : eZ publish

par Roland BENEDETTI et Bertrand DUNOGIER. Je me doutais que ca me plairais moins que le lendemain par Derick.

Aucune méchanceté. Ca ne répond pas à mes attentes, mais je suis développeur et on est le jour des décideurs.

jeu
09
nov '06

Jour 1 - Présentation 5 : canal Php

FranckUne petite pièce de théatre de Cyril Pierre de Geyer, Guillaume Ponçon et Franck LOMBARDI sur l'optimisation et l'industrialisation d'une plateforme de service basée sur PHP.

Lire la suite...

jeu
09
nov '06

Jour 1 - Présentation 4 : PHP au ministère des finances en Belgique

De loin ma conf préférée de la journée. J'ai vérifié, ce n'est pas du patriotisme, cette conf a largement été appréciée. On a eu là un vrai bon retour d'expérience. Sans donner de leçon, Denis Van Nuffelen nous a présenté et justifié leurs utilsation et cadre d'utilisation de PHP au sein du ministère des finances de manière bien contextualisée.

PHP est comme souvent rentré par la petite porte, et grignotte grignotte au sein du ministère les fonctions aux quelles il etait cantoné.

From Kenneth HimschootChaque année on a de nouveaux retours indiques. PHP n'inspire pas confiance aux décideurs qui ne le connaissent pas, puis un php rentre discretement et le développement est tellement rapide que l'équipe ou l'individu qui l'utilise atteint une réactivité bien plus rapide que les développements enkylosés de procédures.

à suivre...

jeu
09
nov '06

Jour 1 - Présentation 3 : PHP dans l'entreprise ... la contribution de ZEND

Zend est présenté par un trié, ils sont 5 à la conf. On sent que Zend France a démarré. L'année passée il n'y avait que Zeev et Shaona.

Ce que ressent fort c'est la baisse de la réputation de "récuperateur commercial de PHP" qu'à zend auprès de la communauté.

Zend ne s'adresse pas aux petits joueurs directement mais ses actions permmettent d'améliorer le joujou.

jeu
09
nov '06

Jour 1 - Présentation 2 : Google API

Une présentation sur Ajax et Web Services en PHP : Google AdWords API avec APIlity. Thomas STEINER y a fait son stage et nous a fait une belle pub des services google. Après la partie un peu marketing mal planqué pour google, on a commencé a voir son api pour travailler avec adWords de goodle à partir d'un appli php.

jeu
09
nov '06

Jour 1 - Présentation 1 : Un certain Rasmus

Rasmus nous a présenté comme a son habitude quelques cas de figure, mais il a commencé par une séance d'optimisation qui passe d'une nécéssité d'une centaine de serveur à un seul. à découvir sur talks.php.net ou le site de l'afup.

jeu
09
nov '06

Depuis le forum l'arrivée

Je vais poster une série de post pour chaque conférence mais ceux-ci seront réédités. Pensez à les reconsulter ils seront stabilisés la semaine prochaine.

Lire la suite...

mercredi 1 novembre 2006

mer
01
nov '06

Tristan Nitot

Tristan Nitot

Je l'ai connu au FOSDEM à Bruxelles, puis vraiment découvert via son blog quand il l'a commencé parce que le sous-titre de son blog m'interpellait particulièrement. Depuis il est devenu Président de Mozilla-Europe. Quand il parle de ce poste, il dit

C'est surtout parce qu'il fallait quelqu'un

Son blog est son interface publique la plus connue, il court toutefois d'une conférence à une autre pour faire passer son message.

Tristan ne cherche pas l'extrémisme mais le milieu. Le STANDARD et nous le présente pour nous faire accepter ce mot même quand on est supporter des mauves.explication pour les pas belges : le standard est une équipe de foot belge et son adversaire aux heures de gloire était l'équipe mauve d'Anderlecht Tristant il y a longtemps Il aime la photographie. Et se préoccupe de ce qu'on est en train de faire de notre planète

Liens divers

samedi 13 mai 2006

sam
13
mai '06

Mathieu Laurent

Mathieu Laurent, membre de l'équipe Claroline.

Lire la suite...

jeudi 6 mai 2004

jeu
06
mai '04

Sébastien Piraux

6 mai 2004Sébastien Piraux, développeur claroline et mangeur de Nutella.

Rentré dans le jeu en tant que stagiaire à l'UCL au sein de l'équipe iCampus. Sébastien a dû remplacer ezBoo générant des statistiques brutes par un système de tracking adapté aux activités pédagogiques.

Après l'obtention de son diplôme, Sébastien à rejoint l'équipe claroline/clarodoc du CERDECAM à l'époque en formation.

Sa pemière tâche y fût la création d'un outil de parcours pédagogique.

Par la suite , le rockeur de l'équipe, travailla principalement sur les outils d'exercice et de travaux.

Il s'est aussi lancé dans l'expérience XUL en créat phpLangEditor. Une application pour éditer plus facilement les fichiers de langue de Claroline (et pour les autres application utilisant le même système simple d'un fichier par langue reprenant des variables.

Tags