PDI no tiene problema en conectarse a cualquier base de datos del que dispongamos un driver JDBC.
La versión comunity por defecto contiene solo algunos drivers, incluido MySQL Connector.
Si no disponemos del conector para nuestro gestor lo descargarmos y lo copiamos en la ruta /data-integration/libext/JDBC
En los siguientes enlaces podemos descargar los conectores para los gestores mas conocidos:
http://www.oracle.com/technetwork/database/features/jdbc/index-091264.html
http://jdbc.postgresql.org/
http://msdn.microsoft.com/en-us/sqlserver/aa937724.aspx
http://dev.mysql.com/downloads/connector/j/
Luego de esta configuración, iniciamos pentaho y creamos una nueva transformación.
En el panel izquierdo, en la pestaña View, damos clic derecho sobre Database connections -> New.
Damos un nombre a la conexión y llenamos los parámetros de nuestra conexión: Servidor, puerto, nombre de la base de datos, usuario y contraseña.
Probamos la conexión con el botón Test, y si la conexión es satisfactoria damos clic en OK.
Luego la conexión aparecerá en el panel izquierdo. Esta conexión solo funcionará para la transformación desde la que se creó. Si queremos compartirla simplemente damos clic derecho sobre la conexión y elegimos Share. Las conexión compartidas quedaran almacenadas en el archivo shared.xml del directorio .kettle (Este directorio por lo general queda en la carpeta del usuario en el sistema) y serán accesibles desde cualquier transformación o trabajo.
Con nuestra conexión creada, puede ser utilizada en todos los pasos que impliquen manejo de base de datos. Los mas conocidos son los que muestra la imagen:
Estos pasos nos permiten seleccionar una conexión desde una lista desplegable, y realizar operaciones tanto DDL como DML en la base de datos, limitado claro está, por los permisos que tenga el usuario con el que configuramos la conexión.
Si tienen alguna duda no duden en comentar, que tengan un muy buen día!