ATENCIÓN: En este hilo no vas a encontrar farragosas explicaciones técnicas y, de hecho, caeré en imprecisiones en muchas ocasiones. De lo que se trata es que todo el mundo comprenda cómo funciona y porqué es importante, independientemente de su nivel de conocimiento.
De una manera o de otra, todos hemos escuchado música en formato digital. Algunos incluso en reproductores MP3 que, a finales de los 90, fueron un éxito.
El primero en producirse comercialmente fue el MPMan F10, con 32 o 64 megabytes de capacidad. Si, megabytes.
Fue tan innovador que creó un nicho de mercado nuevo, al que entraron a competir un buen montón de marcas. Pero fue el Río PMP300 el primer gran éxito comercial:
30 minutos de música, una pila AA que duraba entre 8 y 12 horas y un precio de $200, mas o menos. En 1998.
Lo interesante de estos hitos fue su contribución a la adopción generalizada del archiconocido formato MP3
Pero ¿qué es exactamente un archivo MP3? ¿por qué es importante?
Resumiendo mucho: es la revolución de la industria musical por su tamaño y su facilidad de transporte
Para entenderlo mejor hay que pensar que en el nacimiento de la radiofórmula (en España sobre 1920), existían orquestas que interpretaban en directo la música que se quería radiar.
No fue hasta 1930 que comenzaron a usarse discos de acetato para emitir música popular.
Aún así el LP no llegaría hasta 1950, y por ello la música en directo fue la primera opción hasta que en 1960 explotó el fenómeno fan
Ya se disponía entonces de una calidad de sonido aceptable para emitir aquellos LP por las ondas
Mas tarde llegaron los cassettes y los CDs
Pero la música estaba en un formato físico, y había que transportarla, almacenarla y reproducirla de un modo muy concreto para que no se echara a perder.
Pero en cada nueva iteración de formato, se ampliaba la capacidad de almacenamiento, llegando a 74-80 minutos en un CD.
Y con el CD llegó la música digital.
Pero aunque la música ahora se almacenaba en ficheros digitales, éstos eran muy grandes y pesados.
Tanto que incluso algunos estudios de grabación siguieron usando grabadoras de bobina porque no podían tener los equipos caros necesarios
El sistema digital parecía prometedor, pero era muy costoso y pesado de utilizar.
Ante tal engorro, había que inventarse una manera de hacer esos ficheros mas manejables, pero sin perder calidad de sonido.
Y aparecieron los códecs y con ellos el MP3.
Un códec es un conjunto de algoritmos cuya misión es tomar audio en formato digital, comprimirlo para poder manejarlo con facilidad, y después descomprimirlo para poder reproducirlo adecuadamente
El nombre lo dice todo.
"Códec" es un acrónimo de "codificador-decodificador"
¿Recuerdas cuándo en el cole nos inventábamos símbolos para pasarnos notitas? ¿Y el lenguaje sms?
Estabas utilizando un códec (en tu cabeza) pero no lo sabías.
El objetivo era comprimir el lenguaje porque había poco espacio, pero que el mensaje permaneciera inalterado.
Pues igual funciona un códec de audio.
Existen dos tipos generales de códecs de audio. Los que:
- Eliminan frecuencias inaudibles pero que están en la señal: compresión con pérdida.
y los que
- Eliminan patrones repetitivos de las canciones: compresión sin pérdida.
La compresión con pérdida ocasiona, precisamente, pérdidas de calidad sonora.
Aunque su éxito radica en que esas pérdidas son asumibles por la mayoría de las personas: si no tienes el oído entrenado no lo notarás, y los ficheros serán mucho menos pesados.
No entraremos en grandes disertaciones acerca del formato MP3 y los códecs asociados.
Simplemente conocer que el MP3, como tal, fue descrito y definido en 1988 por el profesor Hans Mussman.
tnt.uni-hannover.de/en/staff/musmann/
Bien, pues sabiendo a grandísimos rasgos lo que es un códec y de dónde viene el MP3, ahora llega Meta (Facebook) y dice que tiene una tecnología de hipercompresión de audio que permitirá escuchar audio con una calidad similar al MP3 pero con un tamaño diminuto... ¿cómo?
Al parecer usan una red neuronal para que la máquina "comprenda" cómo se construye el audio y así pueda "crearlo" sobre la marcha siguiendo un patrón muy pequeño.
Parece ciencia ficción ¿verdad?. Algo parecido (grosso modo) hacen desde hace tiempo con las voces de los GPS
Las voces que se graban para los GPS no son frases completas. Son fonemas y otras construcciones con las que la máquina puede sintetizar frases con entonación y sentido.
Por eso hay veces que, dependiendo del fabricante (y del idioma), se obtienen mejor o peor calidad
La cuestión es que de confirmar el nuevo estándar, se podrían realizar llamadas con poca o muy poca cobertura con una calidad excelente, por ejemplo
Pero las preguntas son muchas ¿será un estándar abierto o Meta (Facebook) se agarrará a su patente?
Esperemos que lo primero
Estamos en la época de la revolución de la IA y nos va a traer muchas alegrías.
Como veis existen ya hoy aplicaciones profesionales de estas IAs y muchas mas que están por venir.
Si te apetece seguir hablando del tema, te espero en
t.co/FOdwI8fSpB