viernes, 29 agosto 2025

Después del escándalo, ChatGPT se prepara para detectar crisis emocionales con nuevas medidas de seguridad

OpenAI ha anunciado una serie de cambios profundos en ChatGPT, su modelo de inteligencia artificial conversacional, con el objetivo de reforzar la protección de los usuarios en situaciones de crisis emocional y mental. La compañía quiere que su herramienta no solo sea un espacio de diálogo, sino también un apoyo responsable que pueda identificar riesgos de autolesión, violencia o angustia grave con mayor eficacia.

Estas mejoras llegan en un momento delicado, marcado por tragedias recientes y demandas judiciales que han puesto en el centro del debate la relación entre adolescentes y ChatGPT. El reto no es menor: garantizar que la tecnología acompañe, pero sin convertirse en un factor de riesgo cuando la vulnerabilidad emocional se cruza con la dependencia digital.

Publicidad

1
ChatGPT: una inteligencia artificial más atenta a las señales de alarma

ChatGPT-OpenAI
Fuente: Agencias

Desde su lanzamiento, ChatGPT ha contado con mecanismos de seguridad diseñados para actuar en conversaciones donde los usuarios expresan pensamientos suicidas o intenciones de autolesionarse. En esos casos, el sistema ofrece recursos de ayuda profesional, bloquea contenido sensible y trata de disuadir a la persona de llevar a cabo cualquier acción dañina.

Sin embargo, OpenAI reconoce que estas medidas no siempre han sido suficientes. Con el paso del tiempo, algunos usuarios aprendieron a eludir las salvaguardas, disfrazando sus intenciones en peticiones aparentemente inofensivas, como pedir ayuda para escribir una historia. A partir de ahora, la empresa quiere que el modelo mantenga una vigilancia más consistente durante toda la conversación y no solo en el primer aviso.

En su blog oficial, la compañía explica que una de las prioridades es mejorar la detección en diálogos extensos. A medida que la interacción se alarga, el entrenamiento en seguridad puede diluirse, y eso representa un riesgo en contextos sensibles. La meta es que ChatGPT se mantenga atento en todo momento y sea capaz de activar recursos de ayuda incluso si los indicios aparecen de forma tardía o fragmentada.

Atrás

Publicidad