Pentaho
Originalförfattare | Pentaho Corporation |
---|---|
Utvecklare | Hitachi Vantara |
Stabil frisättning | 9.2.0.0-290 / 2 juni 2021
|
Operativ system | Windows , Linux , Mac OS X |
Plattform | Java (mjukvaruplattform) |
Typ | Business Intelligence |
Licens |
Pentaho Community Edition (CE): Apache-licens version 2.0 ; Pentaho Enterprise Edition (EE): Hitachi Commercial License |
Hemsida |
Pentaho är programvara för affärsintelligens (BI) som tillhandahåller dataintegration , OLAP-tjänster , rapportering , informationspaneler , datautvinning och extrahera, transformera, ladda (ETL)-funktioner. Dess huvudkontor ligger i Orlando , Florida . Pentaho förvärvades av Hitachi Data Systems 2015 och blev 2017 en del av Hitachi Vantara.
Översikt
Pentaho är ett Java-ramverk för att skapa Business Intelligence-lösningar. Även om den är mest känd för sin Business Analysis Server (tidigare känd som Business Intelligence Server), är Pentaho-mjukvaran verkligen ett par Java-klasser med specifik funktionalitet. Utöver dessa Java-klasser kan man bygga vilken BI-lösning som helst.
Det enda undantaget från denna modell är ETL- verktyget Pentaho Data Integration - PDI (tidigare känt som Kettle.) PDI är en uppsättning mjukvara som används för att designa dataflöden som kan köras antingen i en server eller fristående processer. PDI omfattar Kitchen, en jobb- och transformationslöpare, och Spoon, ett grafiskt användargränssnitt för att designa sådana jobb och transformationer.
Funktioner som rapportering och OLAP uppnås genom att integrera delprojekt i Pentaho-ramverket, som Mondrian OLAP-motor och jFree Report. Sedan en tid tillbaka har dessa projekt tagits in i Pentahos kurator. Vissa av dessa delprojekt har till och med fristående klienter som Pentaho Report Designer, ett gränssnitt för jFree Reports, och Pentaho Schema Workbench, ett GUI för att skriva XML som används av Mondrian för att tjäna OLAP-kuber.
Pentaho erbjuder företags- och communityutgåvor av dessa programvaror. Företagsmjukvaran erhålls genom en årsprenumeration och innehåller extra funktioner och support som inte finns i community-utgåvan. Pentahos kärnerbjudande förbättras ofta av tilläggsprodukter, vanligtvis i form av plug-ins, från företaget och den bredare användargruppen.
Produkter
Serverapplikationer
Pentaho Enterprise Edition (EE) och Pentaho Community Edition (CE).
Produkt | Erbjudande | Typ | Senaste versionen (EE) | Senaste versionen (CE) | Beskrivning |
---|---|---|---|---|---|
Pentaho BA-plattform | EE, CE | Serverapplikation | 7.1 | 7.1 |
Vanligtvis kallad BI-plattformen, och nyligen omdöpt till Business Analytics Platform (BA Platform), utgör kärnan i programvaran som är värd för innehåll som skapas både på själva servern genom plugin-program eller filer som publiceras på servern från skrivbordsapplikationerna. Den innehåller funktioner för att hantera säkerhet, köra rapporter, visa instrumentpaneler, rapportsprängningar, skriptade affärsregler, OLAP-analys och schemaläggning direkt. Kommersiella plugin-program från Pentaho utökar de färdiga funktionerna. Ett fåtal plugin-projekt med öppen källkod utökar också serverns kapacitet. Pentaho BA-plattformen körs i Apache Java Application Server . Den kan bäddas in i andra Java Application Servers. |
Pentaho Analysis Services (Mondrian) | EE, CE | Serverapplikation | 3.7.0 | 3.6.1 | Pentaho Analysis Services, med kodnamnet Mondrian , är en OLAP- server med öppen källkod (online analytical processing), skriven i Java . Den stöder frågespråket MDX (multidimensional expressions) och XML for Analysis och olap4j- gränssnittsspecifikationerna. Den läser från SQL och andra datakällor och samlar data i en minnescache. Mondrian kan köras separat från Pentaho BI-plattformen, men levereras alltid med själva plattformen i både EE- och CE-versioner. |
Pentaho Dashboard Designer (PDD) | EE | Server plug-in | 5.0.6 | - | En kommersiell plugin som tillhandahålls för prenumeranter på Enterprise Edition (EE). Det tillåter användare att skapa instrumentpaneler , som är samlingar av andra innehållskomponenter som visas tillsammans med målet att ge en centraliserad bild av nyckelprestandaindikatorer (KPI) och andra affärsdatarörelser, så att användare kan övervaka dem och fatta beslut. Innehållskomponenter är vanligtvis individuella informationsgrafik , tabeller, OLAP-vyer eller rapporter. Plugin-programmet förenklar skapandet av instrumentpanelen genom användning av layoutmallar, dra-och-släpp-interaktion och ett GUI för att tillhandahålla parametrar och indata till instrumentpanelens komponenter. |
Pentaho Analysis (Analyzer) (PAZ) | EE | Server plug-in | 5.0.6 | - | Pentaho Analyzer-plugin-programmet tillhandahåller en webbaserad, dra-och-släpp OLAP-visare. Det tillåter en användare att visuellt skapa MDX-frågor genom att dra delar av ett tidigare definierat Mondrian OLAP-schema till en duk, där andra aktiviteter kan ske som filtrering, sortering, skapande av beräknade medlemmar från andra mätningar, export av resultattabellen till PDF eller MS Excel , och valfritt grafiska data. Det är också känt att det fungerar på Apple iPads genom att använda webbläsaren Safari. |
Pentaho Interactive Reporting (PIR) | EE | Server plug-in | 5.0.6 | - | Denna plugin gör det möjligt för användare att skapa ad hoc- rapporter på ett visuellt dra-och-släpp-sätt. |
Pentaho Data Access Wizard | EE, CE | Server plug-in | - | - | Denna plug-in är buntad med alla servrar och tillåter användare att skapa nya datakällor för användning i hela systemet från andra databaser eller CSV-filer som laddas upp till servern med hjälp av en installationsguide. Under stegen att skapa en datakälla ges användare också en chans att skapa en datamodell som beskriver hur kolumner eller fält relaterar till varandra och skapar hierarkier av relationer som tid: år, kvartal, månader, veckor och produktdivision, kategori, typ etc. Den resulterande modellen används av Mondrian och alla andra plugin-program som Analyzer eller Saiku för att skapa nya frågor mot den nyskapade datakällan. Den här komponenten är en del av vad Pentaho introducerar som agil BI, vilket helt enkelt innebär att ha ett sätt att utgå från grundläggande data och snabbt iterera genom steg för att upptäcka det rätta sättet att strukturera, studera och presentera data. |
Pentaho mobil | EE | Serverbit | 5.0.6 | - | Ett nytt tillägg sedan 4.5-GA-sviten som är ett användargränssnitt anpassat för användning med Apple iPad. Den avslöjar alla de viktigaste funktionerna i OLAP-analys och körning av rapporter och instrumentpaneler som möjliggör större interaktion på en liten pekskärm. Mobile lägger också till funktioner för att bokmärka favoritinnehåll för enkel åtkomst och konceptet att öppna flera delar av innehåll i flikar. |
Desktop/klientapplikationer
Produkt | Erbjudande | Typ | Senaste versionen | Beskrivning |
---|---|---|---|---|
Pentaho Data Integration (PDI) | EE, CE | Skrivbordsapplikation | Pentaho Data Integration, kodnamnet Kettle, består av en kärndataintegrationsmotor (ETL) och GUI- applikationer som låter användaren definiera dataintegrationsjobb och transformationer. Den stöder distribution på datorer med en nod såväl som på ett moln eller kluster. | |
Pentaho för Big Data | EE, CE | PDI-plugin | N/A | Pentaho for Big Data är ett dataintegrationsverktyg baserat på Pentaho Data Integration . Det tillåter exekvering av ETL- jobb i och utanför stora datamiljöer som Apache Hadoop eller Hadoop-distributioner som Amazon, Cloudera, EMC Greenplum, MapR och Hortonworks. Den stöder även NoSQL- datakällor som MongoDB och HBase . |
Pentaho rapportdesigner | EE, CE | Skrivbordsapplikation | 9.0.0.0-423 | Pentaho Report Designer är en visuell, bandad rapportförfattare. Funktioner inkluderar att använda delrapporter, diagram och grafer. Det kan fråga och använda data från många källor, inklusive SQL , MDX , Community Data Access, skript, statiska tabelldefinitioner och mer. Den består av en kärnrapporteringsmotor, som kan generera rapporter baserade på en XML -definitionsfil lagrad i ett Zip (filformat) med tillägget .PRPT. Många verktyg har utvecklats kring rapporteringsmotorn, inklusive GUI- designers och ad hoc-guider som guidar användaren genom en steg-för-steg-process för att skapa en rapport, med enbart grafiska verktyg utan att behöva skriva någon kod. |
Pentaho Data Mining | EE, CE | Skrivbordsapplikation | Weka | Pentaho Data Mining använde Waikato Environment for Knowledge Analysis ( Weka ) för att söka data efter mönster. Weka består av maskininlärningsalgoritmer för en bred uppsättning datautvinningsuppgifter. Den innehåller funktioner för databehandling, regressionsanalys, klassificeringsmetoder, klusteranalys och visualisering. Baserat på de upptäckta mönstren kan användare förutsäga framtida trender. |
Pentaho Metadata Editor (PME) | EE, CE | Skrivbordsapplikation | 9.0.0.0-423 | Metadataredigeraren används för att skapa affärsmodeller och fungera som ett abstraktionslager från de underliggande datakällorna. De resulterande metadatamodellerna används av Pentaho Interactive Reporting, Saiku Reporting och Pentahos äldre AD HOC-rapporteringsplugin-applikationer för att skapa rapporter inom BA-servern utan att använda någon av de andra externa skrivbordsapplikationerna. |
Pentaho Aggregate Designer (PAD) | EE, CE | Skrivbordsapplikation | 9.0.0.0-423 | Aggregate Designer arbetar på Pentaho Analysis (Mondrian) XML-schemafiler och databasen med de underliggande tabellerna som beskrivs av schemat för att generera förberäknade, aggregerade svar för att påskynda analysarbetet och MDX-frågor som körs mot Mondrian. Detta åstadkoms genom att programvaran undersöker hierarkierna som beskrivs i schemat och de åtgärder som också definieras där och genererar SQL vilket skulle resultera i skapandet av tabeller som lagrar dessa svar för framtida användning av Mondrian. , modifieras den ursprungliga Mondrian XML-schemafilen som beskriver OLAP-kuben för att referera till de förberäknade resultaten. |
Pentaho Schema Workbench (PSW) | EE, CE | Skrivbordsapplikation | 9.0.0.0-423 | Pentaho Schema Workbench tillhandahåller ett grafiskt gränssnitt för att designa OLAP-kuber för Pentaho Analysis (Mondrian). Schemat som skapas lagras som en vanlig XML-fil på disk. Det är inte nödvändigt att använda Schema Workbench för att skapa ett schema, men det är ofta användbart för nybörjare och till och med experter som behöver inspektera en kub visuellt och komma igång med hur man underhåller eller utökar den. |
Pentaho Design Studio (PDS) | EE, CE | Skrivbordsapplikation | 4.0 | Pentaho BA Server stöder speciella XML-skript som kallas xactions för att implementera affärslogik och andra former av automatisering i plattformen. Design Studio är en modifierad version av Eclipse Development Environment med en plug-in som är utformad för att förstå de komponenter som stöds av xaction-skript. Xactions är mycket kraftfulla och användbara, men ibland visar sig vara svåra att felsöka på grund av det låga sättet att interagera med delar av BA-servern. Utvecklare börjar använda Pentaho Data Integration-transformationsfiler för att utföra automatiserings- och affärslogikuppgifter. Transformationerna kan köras direkt av BA-servern och visuellt felsöka i Pentaho Data Integration (PDI) och vinner snabbt fördel i samhället framför xactions. Det är ett litet steg att föreställa sig PDI-transformationer så småningom kommer att ersätta xactions helt. |
Gemenskapsdrivna Pentaho-serverplugin-program med öppen källkod
Alla dessa plug-ins fungerar med Pentaho Enterprise Edition (EE) och Pentaho Community Edition (CE).
Produkt | Typ | Senaste versionen | Beskrivning |
---|---|---|---|
Ctools | Server plug-in svit | Olika | Känd som Community- verktygen, innehåller den ett växande utbud av funktioner som vanligtvis ingår i ett paket med ett förkortat namn där det första C:et alltid står för community och samtidigt representerar dess status som både kostnadsfritt och öppen källkod. Verktygen produceras och hanteras av Webdetails. Dokumentation om verktygen finns på ctools.webdetails.org . Oftast installeras Ctools-sviten med hjälp av ett linux-skript., men det finns planer i en kommande utgåva att ha en pakethanterare inkluderad i BA-servern som hjälper till med installationen. |
Community Charting Components (CCC) | Server plug-in | Olika | Ett kartbibliotek ovanpå Protovis, en mycket kraftfull gratis visualiseringsverktygssats med öppen källkod. Syftet med CCC är att förse utvecklare med ett sätt att inkludera de grundläggande diagramtyperna i sina instrumentpaneler utan att förlora huvudprincipen: utbyggbarhet. Diagrammen som skapas med CCC blir komponenter som visas i instrumentpaneler. |
Community Build Framework (CBF) | Bygg skriptramverk | 3.7 | Fokuserat på ett scenario med flera projekt/multimiljöer, erbjuder Community Build Framework (CBF) ett sätt att ställa in och distribuera Pentaho-baserade applikationer. Det är ett Apache Ant, Java build-script som låter en användare skapa en mall för sin Pentaho BA Server-installation, inklusive patchar och eventuella anpassningar eller speciellt innehåll och rulla ut det snabbt. Det kan hjälpa migrering till nya versioner av BA-servern, och med att snabbt producera skräddarsydda Pentaho-servrar för klienter. |
Community Data Access (CDA) | Server plug-in | senast | Fungerar som ett gemensamt lager för åtkomst av data på Pentaho BA-servern. CDA-filer kan innehålla transformationsfiler för SQL, MDX, Pentaho Data Integration, skriptade datakällor och mer. CDA tillhandahåller också ett REST API för att direkt anropa Pentaho BA-servern och ta emot resultaten av en förfrågan tillbaka som JSON, XML, XLS, HTML eller CSV. Standard är JSON. HTML-utdata gör det enkelt för MS Excel-användare att utföra webbfrågor och dra resultat direkt till en Excel-arbetsbok utan ytterligare programvara i mitten. CDA kommer med i alla Pentahos servrar. |
Community Data Browser (CDB) | Server plug-in | Community Data Browser använder en visuell OLAP-webbläsare som heter Saiku för att skapa en fråga som kan användas av R för att utföra analyser på resultatuppsättningen. | |
Community Distributed Cache (CDC) | Server plug-in | senast |
CDC står för Community Distributed Cache och möjliggör högpresterande, skalbar och distribuerad minnesklustringscache baserad på Hazelcast för både CDA och Mondrian. CDC är en Pentaho-plugin som ger följande funktioner:
|
Community Data Generator (CDG) | PDI jobb | N/A | CDG är en datalagergenerator som hjälper till att skapa exempeldata för att skapa proof of concept-dashboards. Med tanke på definitionen av dimensioner som vi vill ha, kommer CDG att randomisera data inom vissa parametrar och mata ut 3 olika saker:
|
Community Data Validation (CDV) | Server plug-in | CDV lägger till möjligheten att skapa valideringstester på Pentaho BA-servern i syfte att verifiera både integriteten hos själva servern och även de data som används av servern. | |
Community Graphics Generator (CGG) | Server plug-in | senast |
|
Community Dashboard Editor (CDE) | Server plug-in | 20120719 | CDE är ett avancerat användarverktyg för att skapa instrumentpaneler i Pentaho BA-servern. CDE och tekniken under (CDF, CDA och CCC) tillåter användare att utveckla och distribuera instrumentpaneler i Pentaho-plattformen på ett snabbt och effektivt sätt. Det är inte lika användarvänligt som Pentaho Dashboard Designer plug-in, men gör det möjligt för användare att skapa mycket mer sofistikerade design. |
Community Dashboard Framework (CDF) | Server plug-in | 4,8-stabil | CDF kommer med i alla Pentahos servrar. Det är ramverket som används av både CDE och Pentahos Dashboard Designer för att skapa instrumentpaneler på systemet.
|
Community Startup Tabs (CST) | Server plug-in | 1.0 | En Pentaho BA-server levereras ur förpackningen med ett användargränssnitt som kallas Pentaho User Console (PUC) som visar allt innehåll genom att öppna flikar i sig själv. Community Startup Tabs ger ett enkelt sätt att definiera och visa specialiserat innehåll för användare genom att automatiskt öppna flikar när de loggar in.
|
Saiku | Server plug-in | senast | Saiku är en modulär analyssvit med öppen källkod som erbjuder lättvikts OLAP som förblir lätt inbäddningsbar, utbyggbar och konfigurerbar. Det liknar i form och funktion Pentaho Analyzer plug-in. En RESTful server ansluter till befintliga OLAP-system, som sedan driver användarvänlig, intuitiv analys via en lättviktig frontend. |
Saiku-Rapportering | Server plug-in | 1,0-GA |
Ett snabbt utvecklande AD HOC-rapporteringsverktyg, liknande Pentahos plug-in för interaktiv rapportering. Nyckelfunktioner:
|
Licensiering
Pentaho följer en öppen kärnverksamhetsmodell . Den tillhandahåller två olika utgåvor av Pentaho Business Analytics: en community-utgåva och en företagsutgåva. Enterprise-utgåvan måste köpas på en prenumerationsmodell . Prenumerationsmodellen inkluderar support, tjänster och produktförbättringar via årsprenumeration. Enterprise-utgåvan är tillgänglig under en kommersiell licens. Enterprise-licens går med 3 nivåer av Pentaho Enterprise Support : Enterprise, Premium och Standard. Community-utgåvan är en gratis produkt med öppen källkod licensierad under GNU General Public License version 2.0 (GPLv2), GNU Lesser General Public License version 2.0 (LGPLv2) och Mozilla Public License 1.1 (MPL 1.1).
Erkännande
- InfoWorld Bossie Award 2008, 2009, 2010, 2011, 2012
- Ventana Research Leadership Award 2010 för StoneGate Senior Care
- CRN Emerging Technology Vendor 2010 [1]
- ROI Awards 2012 - Nucleus Research
Se även
- Nutch - ett försök att bygga en sökmotor med öppen källkod baserad på Lucene och Hadoop , också skapad av Doug Cutting
- Apache Accumulo - Säkert stort bord
- HBase - Bigtable -modelldatabas
- Hypertable - HBase alternativ
- MapReduce - Googles grundläggande datafiltreringsalgoritm
- Apache Mahout - maskininlärningsalgoritmer implementerade på Hadoop
- Apache Cassandra - en kolumnorienterad databas som stöder åtkomst från Hadoop
- HPCC - LexisNexis Risk Solutions High Performance Computing Cluster
- Sektor/Sfär - distribuerad lagring och bearbetning med öppen källkod
- Molntjänster
- Big data
- Dataintensiv datoranvändning