Cómo Spotify utiliza el Big Data para cambiar la industria de la música | Loogic Startups
Seleccionar página

Artículo realizado por Jonatan Belarde.

El negocio de la música en streaming, que hasta hace poco tiempo tan sólo había sido explorado por algunas startups visionarias y creyentes en el modelo, se ha convertido en una guerra abierta por las principales empresas tecnológicas. A pocos días de que Apple anunciara su propio servicio Apple Music, -que por cierto está siendo investigado por posibles violaciones a las leyes antimonopolio- y Google adecue su plataforma Youtube para ofrecer el servicio, Spotify acaba de levantar una nueva ronda de financiación de 526 millones de dólares que le pemitirá desarrollar su estrategia y mantener sus tres cuartas partes del mercado de los usuarios de música en streaming. Han participado inversores de diferentes regiones y de primer nivel como Goldman Sachs, a través de su fondo Global Private Opportunity Partners, los ingleses Baillie Gifford, Landsowne Partners y Rinkerberg Capital; y los fondos canadienses Senvest Capital y Discovery Capital Management. Asimismo, han invertido también los inversores estadounidenses Halcyon Asset Management, GSV Capital, DE Sahw & Co, Technology Crossover Ventures, Northzone y P. Schoenfeld Asset Management. Pero sobre todo la operadora sueca de telefonía móvil TeliaSonera, que ha invertido 115 millones de dólares en la compañía a cambio de un 1,4 por ciento de sus acciones.

¿Qué hace esta compañía tan atractiva para los inversores? Evidentemente sus cifras, sus resultados, el potencial inmenso del mercado mainstream al que se dirige, su ambición por cambiar la industria de la música y su conocimiento para poder hacerlo. Si alguien piensa que la especialidad y el motor del negocio de Spotify es la música está equivocado. El core-business de Spotify está relacionado con algo diferente llamado Big Data. Su éxito radica en su capacidad y destreza de computación, no en vano Spotify dispone del mayor conglomerado Hadoop de Europa (infraestructura informática de Big Data), en cuyo manejo trabajan 7.000 profesionales de la informática y las matemáticas.

Auténticos maestros del Big Data, Spotify está a la altura de los mejores del mundo como puede ser Google, Facebook o Amazon. No es extraño que una empresa valorada en 7.500 millones de € y que en su día aspiró a comprar Google, se desarrollase en un ámbito como el de la música generadora de ingentes cantidades de datos, y de la que se pueden extraer verdaderos insights (revelaciones) que posteriormente monetizan con notable talento. Spotify predijo el año pasado con un 67% de precisión (que no está nada mal para el número de candidatos que tenían que ser considerados) los ganadores de los premios Grammy examinado los datos de sus usuarios (hábitos de escucha, suscriptores a una lista de reproducción, la popularidad de un artista, etc). Shazan hizo lo propio prediciendo con 33 días de antelación el top de listas de ventas usando sus propios datos.

La categoría de los servicios musicales mediante streaming se ha vuelto suculenta y pone en peligro todo el modelo de la industria musical más tradicional. Este pasado mes de marzo, y por primera vez en la historia, la música consumida en streaming ya genera más dinero que la música distribuida en Cds. Sólo los ingresos pagados por Spotify a los titulares de los derechos de las canciones desde su lanzamiento en 2008 supera los 3 mil millones de dólares.

Con una estrategia basada en las alianzas para incursionar en cualquier tipo de dispositivo y llegar así a todos sus públicos -cualesquiera situaciones se encuentren- ha conseguido importantes acuerdos con los principales fabricantes de smart tv para estar en los hogares, con UBER para estar en los automóviles, con Starbucks en las cafeterías, Nike mientras hacemos running… es ya la líder mundial en distribución de música en streaming.

En 2014 se consumieron 4.500 millones de horas de su música en los 58 países donde se encuentra disponible. De los 60 millones de usuarios activos, más de 15 millones son suscriptores de pago (10€/mes). El ratio del 20% de suscriptores premium es la envidia de la industria tecnológica. Su página de facebook es seguida por 6,8 millones de personas (1,34 millones en Twitter) y sus usuarios han creado 1.500 millones de listas de reproducción. Sólo los usuarios de Spotify generan 600 Gigabytes de datos por día!! También por día se añaden más de 20.000 canciones que en total suman más de 30 millones de canciones almacenadas y reproduciéndose en sus servidores.

Según declaraciones de Frederick Johansson (Marketing Analytics Manager), el enfoque de Spotify se puede resumir con las siglas en inglés DIBB (Datos, Insights, Creencias, Apuestas). Los directivos reciben los datos y los conocimientos derivados del equipo de análisis, y son capaces en muy poco tiempo de desarrollar las ideas e hipótesis que luego se ponen a prueba con inmediatez. Las hipótesis se prueban con un pequeño segmento de clientes de Spotify para entender lo que funciona. Su mantra es Piensa, Construye, Activa, Corrige.

Pero esto no es todo. Con la compra de la empresa The Echo Nest en 2008 por la que pagó 200 millones de dólares, Spotify adquirió la capacidad de extraer y analizar datos de un gran número de fuentes más allá de sus propias bases de datos. The Echo Nest ya era capaz de recopilar diariamente información de más de 10 millones de páginas web de música de las que extrae y correlaciona información sobre titulares periodísticos, declaraciones de los artistas, descripciones y comentarios de los usuarios, catálogos de canciones de todas las partes del mundo… cada palabra que alguien profiere en Internet acerca de la música pasa por los sistemas de Spotify que busca términos descriptivos, sintagmas nominales y otros textos, que posteriormente modelizan en lo que llaman «vectores culturales”. De esta manera crean mapas de características de las canciones y artistas de forma automática a través del análisis acústico y textual. Sus capacidades predictivas asociadas a la tecnología de recomendación le permitió el año pasado recopilar un billón de puntos de datos de 35 millones de canciones de 2,5 millones de artistas que pasaron a formar parte a su inmensa base de datos.

Precisamente uno de los problemas a los que se enfrentaba Spotify antes de la nueva ronda de financiación era de índole económica por tener que ser capaz de procesar tanta cantidad de datos en tiempo real mediante técnicas de Machine Learning, que deben ser capaces de hacer las recomendaciones a los oyentes de canciones y artistas según cientos de parámetros de control en tiempo real. Diariamente, sólo su cluster de 700 nodos de Hadoop genera 4 terabytes de datos con un total de 28 petabytes de almacenamiento repartidos en 4 Data Centers (centros de datos) en todo el mundo. Este servicio lo provee Amazon Web Services (AWS) que se frota las manos con uno de sus clientes más importantes.

El negocio de Spotify se hace basa íntegramente en la analítica de datos y se aplica en prácticamente todos los procesos de negocio de la compañía, desde la inteligencia de negocio para la estrategia, hasta la experiencia de usuario, pasando por el diseño y la ergonomía de navegación en web y aplicaciones, etc…

Spotify ya está trabajando en el uso de un tipo de inteligencia artificial mucho más avanzado llamado «aprendizaje profundo» para hacer una mejor lista de reproducción de música para el usuario y extraer un conocimiento hasta ahora impensado. Mediante esta técnica se teje una red neuronal para el servicio de música en streaming que podría reconocer patrones como progresiones de acordes de la música sin necesidad de expertos en música. De forma automática y hecho por maquinas se extraerían atributos de las canciones hasta el momento no exploradas. Con este sistema se podría introducir a un oyente a una canción, álbum o artista desconocido de acuerdo con sus preferencias auditivas, y no sólo de información escrita. Se trata de mezclar la información escrita de la canción, álbum y artista con la musicalidad y el sonido para establecer patrones de preferencias. Cogiendo las formas de las ondas acústicas y transformándolas en dato se puede crear un modelo genérico con gran potencial para la industria porque permitirá hacer sugerencias de canciones basadas en sus cualidades acústicas (tono, tempo, volumen, distorsión de una guitarra, melodías, voces, secuencias, etc…) y sobre todo permitirá descubrir nuevos nichos de música desconocida para los usuarios. La idea es predecir qué canciones pueden gustar a los oyentes, incluso cuando los datos de uso no están aún disponibles.

Desde recomendarnos qué canción queremos escuchar en función del ritmo que llevamos haciendo footing, mostrar el anuncio que con más probabilidad convertirá a un usuario en cliente, hasta las toplists que con más probabilidad tendrán éxito, la configuración de los botones de las aplicaciones para mejor experiencia de usuario (A/B testing), hasta el enriquecimiento de sus propios datos con otras fuentes como los mapas, datos de salud, transporte, consumo, etc… Spotify dispone de un terreno de juego espléndido para desarrollar su ambicioso plan de transformar la industria de la música; y por ahora lo están haciendo verdaderamente bien.