La start-up catalana Qbeast, participada per BStartup de Banc Sabadell, ofereix un software revolucionari en el tractament de les dades. L'objectiu d'aquest és lluitar amb les plataformes de Big Data que són lentes i complexes, centrat en allò que importa, amb zero configuracions i desplegament amb un sol cloc i amb llenguatges i marcs als quals estem tots acostumats. QBeast és soci de la Barcelona Computing Center i amb la seva tecnologia és capaç d'accelerar el processament de volums elevats de dades sense malgastar recursos computacionals i energia. La tecnologia exclusiva d'indexat multidimensional estadístic brinda a les empreses que analitzen grans quantitats de dades, la possibilitat d'accelerar el processament en els seus treballs de big data, aconseguint que els equips vinculats a dades siguin fins a tres vegades més productius. Creada l'any 2020, en plena pandèmia, ja va tancar una primera ronda de finançament de 520.000 euros i, ara, es troba en un segon procés. Per conèixer com treballen, parlem amb la Paola Pardo, Tech Evangelist & Co-Founder de Qbeast.
Com podem entendre el software que plantegeu des de Qbeast?
Hem de parlar del data manegement com a gran compressor de dades. Primer emmagatzemàvem les dades amb el Data Warehouse, una base de dades eficient a l'hora de llegir aquestes dades i s'utilitzava pel business intelligence. Però comença l'era d'internet amb moltes més dades de diferents tipus, vídeos o imatges, i aquest programa no està preparat i es passa al Data Lake. Un sistema de fitxers en el núvol on pots penjar de tot, està fet per guardar que no estiguin estructurades. Ara bé, què passa? Quan vols analitzar les dades, les has de netejar i copiar a un Data Warehouse. I la nova alternativa és tenir el Data Lake com un Warehouse, més flexible i escalable. Per tant, amb més efectivitat.
"Ordenem de forma eficient"
Quants anglicismes!
És la nomenclatura amb la que ens movem, però perquè ens entenguem és un lloc on pots emmagatzemar qualsevol mena d'informació ja ordenada. Qbeast es dedica a estructurar les dades i adaptar-se a tots els canvis que van passant. Nosaltres ens situem en aquesta darrera fase per donar totes les capacitats d'abans sense moure les dades d'un lloc a un altre per analitzar-les. I Qbeast, a més, les ordena d'una manera especial perquè encara sigui més eficient.
I quan naixeu?
Ens creem el 2020. Ara és quan les empreses s'estan preocupant per les dades. Moltes, fins ara, no els calia i tot depèn de la quantitat de dades que tens prèviament. Però ara, el que estem veient, és que moltes empreses s'estan preocupant de donar un valor a aquestes dades, de la forma més simple possible i no amb complexos sistemes que mantenir. Tot aquest software de dades està en auge total. També perquè comencem a aplicar les dades a molts altres àmbits.
Com ara?
El Machine Learning o el data science, que tracten les dates en cru. Ara bé, si vols tenir business intelligence, has de netejar i processar les dades en un altre software. Per això és millor tenir-ho tot junt i també per gastar menys, des del personal fins al cloud computing.
Costa entendre-ho per aquells que no som prou experts...
Per exemple, jo tinc una pàgina d'ecommerce que genera unes dades que vull entendre i oferir coses pels usuaris que siguin òptimes com un sistema de recomanació. Per fer-ho, necessito un sol sistema. Ara bé, si vull analitzar aquestes dades, les haig de copiar totes i estudiar-les. Per tant, tot és circular i el que s'ha d'evitar és que sigui massa complex de mantenir i que, al final, només un departament tingui aquestes dades. És important compartir tota la informació.
"Encara, l'excel està massa instal·lat"
Ja teniu clients?
Estem parlant amb empreses d'ecommerce o ciberseguretat. Aquesta última és molt interessant perquè podem aportar un extra d'eficiència a l'hora de processar gran quantitat de logs. Més enllà d'aquestes dues també hi ha les grans empreses tecnològiques entre d'altres. És molt generalista dir que pots accedir a qualsevol indústria, però a la pràctica és així, optimitzem molt.
Vau tancar una ronda de finançament l'any 2021. A les portes de tancar el 2022, en quin punt us trobeu?
No podem donar xifres perquè és confidencial, però n'estem tancant una altra i ens dediquem amb els clients a buscar partner ships. Ara mateix estem en una fase on gràcies a l'open source tothom pot provar la nostre tecnologia, però volem que comenci a donar beneficis i, per tant, que els enginyers ja sàpiguen com funciona. Per això ens trobem en una fase de polir el producte.
De totes maneres, la irrupció que heu fet en dos anys és innegable...
El nostre lema es "big data free from the unnecessary", sigues eficient amb les dades i accedeix a elles d'una manera simple! Neteja les coses i ordena, si ho tens tot en caixes sempre saps on està la informació. Podem modificar les features i el producte, però l'essència sempre és la mateixa.
Quin és el vostre mirall ara mateix?
El cloud computing utilitza una arquitectura completament diferent. Moltes opcions d'ell fa que no t'hagis de preocupar certs aspectes com aixecar màquines o data center.
"El nostre mercat també està a Europa"
I el vostre rival?
Crec que més que competir, nosaltres ho veiem més com una integració. Per exemple, la tecnologia core és un format de dades i com aquest n'hi ha d'altres (com Delta Lake, Apache Iceberg i Apache Hudi). Tots ells són formats de taula, és a dir, en el cloud s'escriuen fitxers i el que els formats fan és tractar-los com una taula d'una base de dades. I a partir d'aquí pots interactuar. La nostra funció no és tan suplantar res, sinó integrar-nos amb els altres sistemes, som el complement perfecte. Per exemple, oferim indexació internacional i l'opció de treure samples i fer consultes aproximades.
Des d'aquí, encara estem molt lluny d'introduir aquesta mena de software a les grans empreses?
L'excel encara està molt present arreu! (riures) Sempre és el mateix: als Estats Units està tot avançat i nosaltres anem copiant. Ara bé, pel que es respira a l'ambient, a Linkedin veus que des de Catalunya i en el conjunt d'Espanya es comencen a contractar big data engineers i això és un bon símptoma. A nivell de com gestiones i com funciona la teva organització, diu molt d'una empresa tenir contractada una tecnologia o altra. Ara bé, és important com a raonament inicial, tenir una estratègia fixada perquè, a partir d'aquí, podem aplicar el que millor ens convé.
Per tant el vostre client està a Amèrica?
No necessàriament. Crec que Europa és un bon mercat actualment, sense deixar de banda els Estats Units on es mouen molts diners. Ara ens trobem en una fase d'experimentació i d'implementació del nostre software. Pensa que aquest és integrable en tot l'ecosistema. Més enllà de la migració d'un sistema que sempre és dura, sobretot si tens grans quantitats de dades, però quan abans ho facis millor. En paral·lel també estudiem el Machine Learning, com aquestes dades pot analitzar processos de dades, és a dir, com entrenar un model més ràpidament gràcies a l'organització de les dades. Ens esperen uns anys molt bons!
"Cal formar més en software"
I qui hi ha darrere de QBeast?
Som cinc fundadors. El Cesare Cugnasco, CEO amb un background potent d'investigació, el Clemence Jesche CBDO (Chief Business Development Officer) qui porta la part de negoci i apropa la nostra visió als clients, el Nicolas Escartín COO (Chief Operation Officer) qui va treballar també amb Barcelona Activa, i el Pol Santamaria CTO, qui també té un gran trajectòria tècnica.
Cal estendre més la cultura de l'enginyeria informàtica?
Des de la mateixa carrera no ens formen en aquest aspecte i es troben a faltar casos pràctics. Més enllà d'aprendre de física o matemàtiques, en el conjunt de la societat i de les seves ciències pròpiament, cal més cultura sobre el tractament de les dades. Això, actualment, només es troba o et pots acabar de formar en un màster o a la mateixa feina on, personalment, he trobat tots els recursos necessaris per acabar d'aprendre.