Alejandro De la Garza
IA para autores desempleados y escritores de prompts
09/05/2026 - 12:02 am
"En este ecosistema tecnológico revolucionado por la IA, lo que urge ahora a las empresas son personas con conocimiento profundo del lenguaje, literatura y cultura".

El sino del escorpión alucina con el hecho de que los modelos de inteligencia artificial han agotado gran parte de la información humana útil disponible en la web abierta. Hablamos de algo en efecto alucinante, insiste el alacrán, los diversos modelos de IA continúan, en este preciso instante, devorando cada vez más y más de la masa de información producida por humanos y contenida en la red abierta. Según el odioso facho Elon Musk, hemos alcanzado el “pico de datos”; otros especialistas aseguran que llegamos ya a un “techo práctico”.
Según la prensa tecnológica, la suma de datos generados por humanos que son útiles para desarrollar el entrenamiento de la IA generativa ha bajado su ritmo de crecimiento, mientras, en contraste, aumenta la velocidad de absorción de información de los diversos modelos de IA.
Varios factores contribuyen a esta percepción de que ya se ha alcanzado un límite. Entre ellos, el aumento de las restricciones de acceso y la monetización para obtener información, pues cada vez más sitios bloquean rastreadores, aplican robots o monetizan contenido para de esta forma reducir el porcentaje de datos de la web accesibles para el entrenamiento de la IA a gran escala.
A lo anterior, se suman litigios y exigencias de consentimiento que implican demandas y reclamos legales de editores contra proveedores de modelos de IA por el uso no autorizado de sus datos, lo que lleva a negociaciones y a definir límites jurídicos al scraping. Se denomina scraping masivo, en términos de IA, a la extracción automática de información de páginas web y su conversión en datos estructurados (bases de datos), para ser analizados o utilizados en sistemas digitales de información, una suerte de apropiación que incluye, además, la preparación de esos datos para entrenar o alimentar modelos de aprendizaje automático de inteligencia artificial.
Pero el alucine continúa, se marea el escorpión, pues ante la escasez de información creada por humanos ha proliferado la dependencia creciente de los llamados “datos sintéticos”. El concepto de “contenido sintético” se refiere a cualquier texto, imagen, audio o vídeo generado o alterado por modelos de IA, es decir no creado por la captura o autoría humana directa. Estos datos sintéticos incluyen deepfakes, voces, imágenes generadas y datasets sintéticos usados para alimentar y entrenar las absorbentes inteligencias artificiales.
Ese contenido sintético se utiliza con varios fines, entre ellos, para incrementar datos, es decir generar variantes sintéticas para cubrir escasez de información y equilibrar datasets. De igual forma, se utiliza para entrenamiento y fine-tuning (curaduría) cuando los modelos trabajan sobre grandes volúmenes de contenido híbrido, es decir sintético y real, con el fin de aprender patrones de lenguaje, imagen y audio. Otro uso importante de los datos sintéticos es aplicarlos en “sustitución por privacidad”, es decir que estos datos sintéticos permiten simular poblaciones para estudios o estadísticas sin exponer información personal sensible.
Ahora mal, frente a los beneficios aportados por el contenido sintético, también hay una variedad de riesgos, como la proliferación de la desinformación y las deepfakes; los sesgos (género, etnia, clase, estatus) reflejados o amplificados por datos sintéticos; los problemas con los derechos de autor, la pérdida de autenticidad y el uso malicioso o engañoso.
Varios expertos han señalado las consecuencias perniciosas del uso extendido de datos sintéticos; entre ellos, el escorpión registra a Ilia Shumailov, investigador destacado en inteligencia artificial y seguridad informática en Cambridge, quien alerta del riesgo de “colapso” y degradación de la calidad informativa. Jutta Haider y Björn Ekström, investigadores en ciencias de la información en la Universidad Borás de Austria, quienes han denunciado la proliferación de “ciencia basura” y sus riesgos para la investigación y la confianza pública.
A su vez, el periodista catalán especializado en tecnología, inteligencia artificial y poder político, Carles Planas Bou, quien sintetiza y difunde investigaciones sobre cómo la retroalimentación de datos sintéticos puede intoxicar modelos y amenazar buscadores y medios tradicionales, y advierte también sobre los llamados “bucles de información sintética”, que siguen alimentándose y difundiendo repetidamente nociones erróneas.
El llamado tecnofeudalismo está en proceso continuo de adaptación a este fenómeno, y mientras crece el debate técnico y algunos afirman que se ha alcanzado ese “techo práctico”, otros sostienen que existen todavía fuentes alternativas de datos (¿para saquear?) como repositorios académicos y universitarios, acuerdos comerciales, bibliotecas digitales restringidas, datos especializados y bases de datos privadas, reserva de información que aseguran permitirá incrementar la disposición de información humana por parte de la IA.
En este desconcertante ecosistema tecnológico revolucionado o descoyuntado por la IA, lo que urge ahora a las empresas y corporativos son personas con conocimiento profundo del lenguaje, la literatura y la cultura (filólogos, lingüistas, lexicógrafos, autores, profesores, docentes, periodistas, redactores y otros especialistas), con conocimientos de aprendizaje automático (machine learning) y procesamiento natural del lenguaje natural (PNL), para entrenar a las inteligencias artificiales en especialidades como por ejemplo, la crítica literaria.
Para ilustrar esa demanda de humanos para entrenar a la IA, el venenoso refiere algunas ofertas de empleo remoto provenientes de plataformas como LinkedIn. Hay quien solicita redactor de prompts para entrenamiento de IA, “que cree las preguntas, escenarios y desafíos que empujen a los modelos de IA hasta sus límites y los ayuden a ser más inteligentes, seguros y realmente capaces. Se requiere amor por el lenguaje y las ideas”.
Otro corporativo llama a escritores y autores para entrenamiento de IA, “aquí aprovecharás tu pasión por el lenguaje y la comunicación para afinar modelos de IA, asegurando que produzcan textos atractivos, precisos y con tono humano”. Deberás “investigar tendencias actuales de escritura, géneros y las mejores prácticas para orientar las estrategias de entrenamiento de IA, con énfasis en mejorar la estructura narrativa y la calidad lingüística. Requieres conocimiento de diversos géneros de escritura y estándares editoriales avanzados”.
El escorpión atinó por fin a una oportunidad para un escritor-redactor freelance que quiera entrenar la IA. “¿Eres especialista en el español de México y quieres ayudar a moldear el futuro de la IA? Con datos de alta calidad la IA del mañana podrá comprender mejor los matices regionales del idioma, el contexto y el tono, y fomentar el intercambio intercultural. Este entrenamiento comienza contigo: no se trata sólo de redacción tradicional —advierte la oferta—, crearás textos que enseñen al modelo razonamiento, precisión lógica, matices y claridad”.
En este momento el venenoso se disculpa con la gayola por retirarse con urgencia, pero debe actualizar su CV.
MÁS EN Opinión
Pedro Mellado Rodríguez
En Coahuila, una golondrina no hace verano
""Aunque la oposición echó las campanas al vuelo por el triunfo del PRI en los comicios locales de Co..."
Fabrizio Mejía Madrid
El Mundial
""Así llegan los tres países a un Mundial pensado en otro momento, cuando el tratado comercial no imp..."
Francisco Ortiz Pinchetti
Rueda el balón: los costos... y las ganancias
""Con un gobierno supuestamente ‘de izquierda’, el presupuesto público sirvió, una vez más, para enri..."



