Pentaho ist die führende Open Source BI Suite. Diese bestehr aus einer Sammlung von Tools, die alle Belange des Datenhandlings abbilden konnen. Sowohl Datenintegration als auch Reporting, Metadata-Management und OLAP sind Teil der Suite.
PDI – Pentaho Data Integration
PDI ist das Arbeitstier der Pentaho Suite. Transformationen können in Jobs zu komplexen Datenintegrationsabläufen orchestriert werden und durch Javas plattformunabhängigkeit sowohl auf Window-Servern als auch auf (headless-)Linux Maschinen laufen. Es gibt Konnektoren zu allen üblichen RDBMS und Bigdata Tools, so dass Interfaces ohne Probleme realisierbar sind. Die Konnektoren, die nicht mitgeliefert werden können im Marketplace heruntergeladen und in PDI integriert werden. Nach der Übernahme von Pentaho durch Hitachi hat die Community etwas an Schwung verloren. PDI ist aber nach wie vor ein robustes Arbeitstier zur Datenintegration
PRD – Pentaho Report Designer
PRD wird zum Design der Reports benutzt, die dann auf dem Reporting-Server den Usern zur Verfügung gestellt werden. Der Designer ist etwas altbacken, tut aber seine Aufgabe sehr zuverlässig, wenn man weiss, was man tut. Auf dem Reporting Server können diese Reports dann auch gescheduled und Benutzern automatisiert zur Verfügung gestellt werden
PSW – Pentaho Schema Workbench
Mit der PSW werden OLAP Mondrian Schemas definiert, die dann auf dem Reporting Server bereitgestellt werden können. Dort können die Daten dann – ähnlich eines Excel-Pivots – analysiert und visualisiert werden
Ressourcen
Support und Dockumentation findet man auf der Website. Viele Fragen sind in den verschiedenen Pentaho Foren beantwortet. Der IRC Channel ist leider eingeschlafen.
Zukunft / Apache HOP
Anfang 2020 hat das Entwicklerteam um PDI einen eigenen Fork von PDI genommen und stark verschlankt. Nach sehr intensiven Entwicklungen ist HOP Apache Projekt geworden und hat sich vom Look-And-Feel etwas von PDI entfernt. Langfristig könnte dies der logische Nachfolger von PDI werden.