ITPT

18 juillet 2013

MarkLogic, leader du NoSQL d'entreprise

Philippe Nicolas, Gary Bloom et Christopher Lindblad
MarkLogic (www.marklogic.com), éditeur leader de bases de données NoSQL, a accueilli l'équipe de l'IT Press Tour pour une session très intéressante avec 5 executives dont Gary Bloom, patron emblématique et toujours détenteur du record mondiale de la transaction pour le secteur du logiciel lors de la vente de Veritas à Symantec en 2005.
MarkLogic se positionne en rupture avec les approches traditionnelles et historiques des bases de données très rigides et inadaptées au monde très changeant en rapide mouvement que nous vivons. Les données à collecter sont variées, en grande quantité et de format très différent. Pareil pour le nombre d'utilisateurs qui ne se limite pas aux seuls utilisateurs d'une grande entreprise, disons 100 000 utilisateurs, important pour une entreprise, mais à Internet où l'on compte plusieurs centaines de millions d'Internautes. Le meilleur exemple demeure Facebook qui a inventé Cassandra et qui utilise à fond HBase.
Donc MarkLogic vise toutes les données sans structure particulière, à vocation de forte évolutivité, avec un mécanisme avancé de requêtes et de search, très rapide et très bon en analytique. La solution MarkLogic regroupe 3 grands piliers: La base de données bien sûr, le search donc et les services applicatifs. Les références sont nombreuses et variées et touchent tous les secteurs. L'illustration des données des jeux olympiques sont éloquentes à ce titre.
L'idée centrale de MarkLogic est de constituer un vrai puits de données capable de recevoir tout type de données et de les indexer à la volée. On comprend immédiatement le rôle central de consolidation des informations d'entreprise. Le serveur MarkLogic fait parti de la catégorie Document NoSQL avec une liste de fonctionnalités impressionnante le listant immédiatement en tant que leader de la catégorie Enterprise. MarkLogic apporte la scalabilité d'une base "Internet" à l'Entreprise.


Mais la grande nouveauté est la version 7 de MarkLogic Server avec plusieurs clés: l'intégration de la sémantique au mode search et une très grande agilité avec l'élasticité, le stockage multi-niveaux et Hadoop. On l'aura compris, la partie sémantique vise à apporter un sens au requête et permettre un retour d'information compris et suggéré par le nouveau moteur baptisé Power. Celui-ci intègre un nouveau RDF (Resource Description Framework), un mode de query basé sur SPARQL 1.0 et la possibilité de faire des requêtes sur triplets complexes, documents et valeurs. Cette version combine un "triple-store", un document-store et un value-store. Côté Elasticité, MarkLogic offre le Dynamic Provisioning, le rééquilibrage à chaud et la capacité de tourner sur VM, Amazon AWS et Hadoop. Le serveur peut donc opérer son service sur HDFS et ainsi remplacer HBase, la base open source Apache. Pour la partie Tiered Storage, l'idée est de placer les données sur le "bon" stockage c'est-à-dire en fonction de leur valeur. On comprend que le serveur MarkLogic 7 pourra stocker des données sur du SSD ou HDD, sur HDFS et sur Amazon S3 pour ainsi constituer une galaxie de données, très disponible et géographique accessible. Bien vu.
MarkLogic, même si les données financières ne sont pas disponibles, semble avoir réalisée environ 80M$ en 2012, dans les ratios des éditeurs avec pour 250 employés, un rapport à 320k$ par tête. La société devrait doubler son revenu cette année et toucher une valorisation entre 1,5 et 2B$. Et oui, MarkLogic est une vraie pépite de cette nouvelle vague de la base de données. A suivre de près. Félicitations et bravo à toute l'équipe.

Aucun commentaire :