#sphinx


  • À propos de l’hébergement de seenthis.net

    Après la panne (définitive) de la dedibox d’@arno où @seenthis était installé au départ, le site a migré sur le serveur de @rezo.

    Il y tourne depuis un moment sans problème de charge ni d’espace disque, et peut continuer à tourner ainsi un certain temps. Nous ne sommes donc pas contraints par l’urgence.

    Mais à moyen terme cette situation n’est pas désirable, ni pour moi (qui ne souhaite pas héberger les contenus d’un site ouvert au public), ni pour le projet (qui ne devrait pas reposer sur une seule personne).

    Je souhaite donc (en accord avec @arno) que se mette en place un groupe qui prenne en charge cet hébergement à tous points de vue (disons : démocratique, financier, technique et administratif). Nous participerions à ce groupe.

    Description technique

    Basé sur #SPIP, seenthis.net nécessite à l’heure actuelle un dispositif #LAMP ; son moteur de recherche utilise #Sphinx ; on emploie #Varnish en front pour alléger le trafic sur #Apache.

    Des backups quotidiens hors-site sont automatisés (et vérifiés de façon régulière). Les notifications sont envoyées via postfix (et parfois via #mandrill quand ça coince au niveau réception).

    Les utilisateurs remontent régulièrement :
    le besoin d’ajouter https sur le serveur (avec un certificat #letsencrypt)
    le fait que les mails de notification tombent souvent en spam

    Évolutivité

    On aimerait aussi que le serveur ne bloque pas les pistes de développement qu’on peut déjà avoir en tête :
    -- d’envoyer des mails à quelqu’un (pour des messages privés)
    -- de récupérer/synchroniser ses messages via github/rsync/
    -- d’avoir plusieurs instances communiquant en réseau (à la mode diaspora*) / révision de l’API / branchement sur d’autres réseaux / SàT.
    -- etc.

    http://seenthis.net/messages/420961 via Fil


  • Plugin Indexer

    Le logiciel SPHINX est un moteur dédié qui indexe et range un ensemble d’informations multiple pour permettre une recherche rapide.
    Sphinx est un logiciel dédié à l’indexation d’informations textuelles. Cette spécialisation offre une finesse et des temps de réponses plus rapide et précis qu’un moteur de recherche intégré comme celui de Mysql.

    La source des documents indexés peut être n’importe quoi, une base de données, un flux d’informations, un tas de fichiers, des courriels ... Sphinx est neutre vis à vis du contenu, ce qui importe c’est de fournir des documents textuels.

    Le plugin « indexer » transmet à Sphinx l’intégralité du contenu des articles saisis et modifiés dans SPIP en temps réel (mode RT). Cela signifie qu’une fois un article publié celui est directement disponible dans les résultats de recherche.

    Sphinx traite ensuite les informations fournies afin de les classer, trier, ordonner, rapprocher et définir des ratios de pertinence. Dans le même temps les facettes sont actualisées.

    http://contrib.spip.net/Indexer-Introduction

    #spip_blog #sphinx

    http://seenthis.net/messages/386844 via b_b