Pentaho
Da Wikipedia, l'enciclopedia libera.
Indice |
[modifica] La storia
Pentaho è una piattaforma di Business Intelligence (BI) open source fondata nel 2004 da un team di professionisti della Business Intelligence provenienti da aziende di successo come Business Objects, Cognos, Hyperion, IBM, Oracle Corporation, e SAS Institute. L'obiettivo perseguito da questo software non è quello di fornire un'alternativa Open Source, ma di proporre una soluzione migliore rispetto alle offerte commerciali in termini di caratteristiche, funzioni e benefici, attraverso l'integrazione in un'unica piattaforma di popolari progetti Open Source come JFreeReport, Kettle, Mondrian e Weka. Le tecnologie utilizzate sostengono un'ampia serie di operazioni legate al business come l'analisi delle vendite e del profitto, l'analisi del cliente, HR reporting, Financial reporting, KPI dashboards, analisi della Supply Chain e segnalazioni operative.
[modifica] Il progetto
La piattaforma Pentaho BI è diversa dai prodotti tradizionali di business intelligence. Al di là di considerazioni che riguardano l'architettura in senso generale, la principale novità risiede nel fatto che le strutture ROLAP di un progetto vengono portate nella memoria RAM in modo tale che queste possano essere gestite con prestazioni paragonabili ai moderni motori MOLAP. Si parla quindi di HOLAP per indicare un sistema ibrido (HO - hibrid OLAP), sottolineato peraltro dallo stesso nome della società "Penta-ho". Al giorno d'oggi questa possibilità è praticabile grazie ai più potenti elaboratori in commercio e ai sempre più ridotti costi delle memorie RAM.
La piattaforma integra le seguenti soluzioni:
- Mondrian OLAP
- JPivot
- Kettle
- Weka
- JFreeReport
Sono disponibili alcuni componenti sviluppati da terze parti:
- Ramsetcube : è un tool per la creazione delle strutture olap
- Jrubick : è un client OLAP che permette di effettuare delle analisi mirate
[modifica] Il framework
Il framework messo a disposizione da Pentaho permette di sviluppare soluzioni complete per la Business Intelligence:
- La piattaforma è process-centric perche il controllore centrale è il Workflow engine. Il Workflow engine usa le definizioni dei processi per definire il processo di business intelligence che esegue nella piattaforma. Il processo può essere facilmente personalizzato ed è possibile aggiungere nuovi processi. La piattaforma include componenti e report per analizzare le prestazioni di questi processi.
- La piattaforma è solution-oriented perché le operazioni della piattaforma sono specificate nel processo di definizione e nei documenti delle operazioni che specificano ogni attività.
Questi processi e queste operazioni insieme definiscono la soluzione al problema di business intelligence. La soluzione può essere facilmente integrata nelle procedure di business esterne alla piattaforma. La definizione della soluzione può contenere un certo numero di processi e operazioni.
La piattaforma è composta:
- dal Framework di BI, fornisce procedure per logging, auditing, security, scheduling, ETL, web services, attribute repository e rules engine;
- dai componenti di BI, includono componenti per il reporting, l’analisi, il workflow, il dashboards e per il data mining;
- dal Workbench di BI, è un insieme di strumenti di progettazione e di amministrazione che sono integrati nell’ambiente Eclipse. Questi strumenti permettono agli analisti e ai progettisti di creare report, dashboard, modelli di analisi e processi di business intelligence;
- dai desktop Inboxes, possono essere lettori #REDIRECTRSS di terze parti o Pentaho Inbox Alerter. Le Inboxes consegnano le notifiche generate da processi e report;
Il framework e i componenti per la business intelligence sono progettati per usare il workbench e sono forniti dal server Pentaho. Il server Pentaho è un motore guidato dal workflow engine, che coordina l’esecuzione e la comunicazione tra i componenti.
Il controllo centralizzato del workflow engine è essenziale nell’architettura della piattaforma.
- La piattaforma è costruita su processi e processa definizioni. La piattaforma è in grado di comprendere la natura dei processi perché tutto quello che esegue in essa è un processo.
- I processi sono definiti con un linguaggio standard di definizione dei processi e sono visibili, modificabili e personalizzabili dall’esterno.
- Logging, auditing e security sono assicurati dal cuore del framework e sono utilizzati automaticamente per essere sicuri di avere dati accurati di audit e per monitorare le prestazioni.
La piattaforma Pentaho BI è costruita su delle fondamenta formate da server, motori e componenti open source. Questi forniscono il server J2EE, la sicurezza, il rules engine, il content management e il data integration del sistema. Molti di questi componenti sono basati su standard e possono essere sostituiti con altri prodotti. Per creare una soluzione integrata Pentaho ha aggiunto:
-
metadati comuni per la definizione di documenti;
-
interfacce utente comuni;
-
sicurezza;
-
notificazione tramite email;
-
installazione, integrazione e validazione di tutti i componenti;
-
semplici soluzioni;
-
connettori tra le applicazioni;
-
strumenti per la diagnostica;
Il server Pentaho è costruito sopra al framework e ai componenti di BI. Il server esegue dentro a un web server J2EE compliant come Apache, Jboss AS, WebSphere, WebLogic e Oracle AS. Il framework e i componenti possono essere incorporati al suo interno o in altri server o applicazioni. Il diagramma che segue mostra le relazioni tra i maggiori componenti all’interno del server.
Il server fornisce numerose funzioni alla piattaforma per presentare agli utenti le informazioni come preferiscono. I contenuti dei componenti possono essere richiamati in XML, HTML o essere inclusi in portlet JSR 168.
Inoltre contiene i motori e i componenti per creare report, fare analisi, definire business rules, mandare notifiche e fare workflow. Questi componenti sono integrati insieme quindi possono essere utilizzati per risolvere problemi di business intelligence.
I documenti che definiscono le soluzioni ai problemi di BI sono documenti XML che contengono:
- la definizione del processo di business;
- la definizione di attività che eseguono come parte di un processo. Queste attività includono definizioni per la sorgente dati, le query, i template per i report, le regole di notificazione, le regole di business,…;
- la relazione tra tutti gli elementi descritti sopra.
I componenti nel server contano su un Solution Engine per le informazioni che riguardano i documenti delle soluzioni, per la sicurezza, per le informazioni sui report e sugli elementi del workflow e per l’auditing. Più di una soluzione può essere eseguita nel server. I documenti che descrivono le soluzioni possono essere copiati da un server ad un altro e possono essere distribuiti liberamente.
Il server Pentaho contiene una struttura che fornisce un sistema di amministrazione avanzato. Questo include servizi di monitoraggio, supporto per i Web service, strumenti di validazione delle configurazioni e strumenti di diagnostica.
Contiene sistemi e componenti che forniscono strumenti di reporting e analisi delle prestazioni. Questi includono caratteristiche di slice-and-dice, what-if e data mining sugli attributi degli elementi del workflow, su processi singoli e servizi implicati nel processo di workflow. Il server Pentaho include uno strumento per l’integrazione la trasformazione e il caricamento dei dati (ETL).
; La piattaforma utilizza standard aperti e protocolli come: XML, JSR-94 (JCP’s Rules Engine API), JSR-168 (JCP’s Portlet Spec), SVG (Scalable Vector Graphics), XPDL (WFMC XML Process Definition Language), Xforms (W3C Web Forms), MDX (Microsoft OLAP Query Language), WSBPEL(Web Services Business Process Execution Language), WSDL (Web Services Description Language) e SOAP(Simple Object Access Protocol).