El cofundador de Ethereum advierte que la gobernanza liderada por IA podría ser explotada y pide supervisión en info-finanzas

Bitget App

Opera de forma inteligente

Coinotag2025/09/15 02:38

Mostrar el original

Por:Jocelyn Blake

El riesgo de gobernanza de la IA es el peligro de que los sistemas autónomos de IA que controlan fondos o la gobernanza puedan ser explotados o manipulados, produciendo resultados catastróficos. Vitalik Buterin advierte que los jailbreaks y las integraciones de aplicaciones pueden canalizar recursos hacia actores maliciosos, por lo que la supervisión humana robusta y el escrutinio de los modelos son esenciales.

Vitalik Buterin advierte que la gobernanza liderada por IA puede ser manipulada mediante jailbreaks e integraciones de aplicaciones.
El investigador de seguridad Eito Miyamura demostró cómo las integraciones de aplicaciones pueden exponer datos privados a explotaciones de IA.
Se recomienda arquitecturas de info finance con modelos diversos y revisiones humanas para reducir el riesgo sistémico.

Riesgo de gobernanza de la IA: Vitalik Buterin advierte que la gobernanza liderada por IA puede ser explotada—lee el análisis, las pruebas y las salvaguardas recomendadas. Descubre qué deberían hacer los responsables políticos y los desarrolladores a continuación.

¿Qué es el riesgo de gobernanza de la IA?

El riesgo de gobernanza de la IA es la amenaza de que los sistemas autónomos de IA encargados de la toma de decisiones—especialmente la asignación de recursos—puedan ser manipulados para producir resultados dañinos. Vitalik Buterin enfatiza que sin controles en capas, los atacantes pueden usar prompts e integraciones para subvertir la lógica de decisión y redirigir fondos o datos.

¿Cómo pueden ser manipulados los sistemas de IA?

Los agentes de IA pueden ser engañados utilizando prompts de jailbreak incrustados en entradas cotidianas. El investigador de seguridad Eito Miyamura demostró una explotación donde una invitación de calendario o una integración de aplicación podría entregar un comando oculto que, una vez procesado por una IA, expone el contenido de correos electrónicos o archivos.

Estas explotaciones muestran que las integraciones de aplicaciones (ejemplos: Gmail, Notion, Google Calendar mencionados como contexto) amplían la superficie de ataque. Los atacantes pueden crear entradas que parecen benignas pero que cambian el comportamiento del modelo cuando se leen durante tareas rutinarias.

¿Por qué Vitalik Buterin se opone a la gobernanza de IA totalmente autónoma?

Buterin argumenta que la gobernanza autónoma de la IA amplifica el riesgo sistémico. Recomienda un enfoque de “info finance” donde múltiples modelos independientes compiten y son auditados por jurados humanos y revisiones automáticas. Esta combinación está diseñada para revelar fallos del modelo rápidamente y mantener incentivos para el desarrollo honesto.

¿Cómo reducir el riesgo de gobernanza de la IA?

La mitigación práctica requiere defensas en capas:

Limitar el alcance: restringir que los sistemas automatizados muevan fondos unilateralmente o tomen decisiones finales de gobernanza.
Diversidad de modelos: desplegar múltiples modelos y comparar resultados para detectar anomalías.
Supervisión humana: requerir revisión humana para decisiones de alto riesgo y mantener registros de auditoría.
Filtrado de entradas: sanear y marcar entradas no confiables de aplicaciones y calendarios compartidos.
Incentivos y auditorías: recompensar a auditores independientes y mantener programas de recompensas por errores.

¿Qué pruebas respaldan estas preocupaciones?

Demostraciones reportadas por investigadores de seguridad han expuesto cómo las integraciones de aplicaciones pueden ser abusadas. Eito Miyamura (EdisonWatch) mostró un escenario donde una entrada de calendario aparentemente inocua podría desencadenar la exfiltración de datos una vez leída por una IA conversacional. Tales demostraciones subrayan vectores de ataque en el mundo real.

Comparación: Gobernanza de IA vs Info Finance Característica Gobernanza de IA (Autónoma) Info Finance (propuesta de Buterin)

Control de decisiones	Solo IA	IA asistida + revisión humana
Resiliencia a la manipulación	Baja sin salvaguardas	Mayor debido a la diversidad de modelos
Transparencia	Resultados del modelo opacos	Auditorías y revisiones aleatorias
Alineación de incentivos	Riesgo de manipulación	Incentivos para auditores y desarrolladores veraces

Preguntas Frecuentes

¿Puede una IA ser realmente engañada o manipulada por prompts?

Sí. Las demostraciones han mostrado que prompts bien diseñados o comandos ocultos en las entradas pueden alterar el comportamiento de la IA. Las salvaguardas prácticas incluyen la sanitización de entradas, el uso de múltiples modelos y puntos de control humanos para prevenir manipulaciones maliciosas.

¿Deberían los DAOs entregar la gobernanza a la IA?

La evidencia actual sugiere que entregar el control completo a la IA es prematuro. Los diseños híbridos que requieren aprobación humana para acciones críticas reducen el riesgo catastrófico mientras aprovechan la IA para análisis y recomendaciones.

Puntos Clave

El riesgo de gobernanza de la IA es real: Las demostraciones muestran que la IA puede ser manipulada mediante prompts e integraciones.
La supervisión humana es esencial: Se requiere revisión humana y registros de auditoría para decisiones de alto impacto.
Info finance ofrece un camino más seguro: Múltiples modelos, revisiones aleatorias e incentivos pueden reducir la explotación.

Conclusión

La advertencia de Vitalik Buterin destaca que la IA en la gobernanza presenta peligros sistémicos significativos si se implementa sin salvaguardas. Las pruebas de investigadores de seguridad muestran que existen explotaciones prácticas. Adoptar un modelo de info finance—combinando diversidad de modelos, auditorías continuas y supervisión humana obligatoria—ofrece un camino pragmático hacia adelante. Los responsables políticos y desarrolladores deben priorizar las auditorías y las estructuras de incentivos ahora.

Publicado: 15 de septiembre de 2025 | 02:50

Autor: Alexander Stefanov — Reportero en COINOTAG

Menciones de la fuente (texto plano): Vitalik Buterin, Eito Miyamura, EdisonWatch, ChatGPT, Gmail, Notion, Google Calendar.

En caso de que te lo hayas perdido: los ingresos impulsados por stablecoins de Tron pueden estar reforzando su dominio en el mercado

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Haz staking y gana nuevos tokens.

APR de hasta 12%. Gana más airdrop bloqueando más.

¡Bloquea ahora!

También te puede gustar

El equipo de Native Markets gana la licitación de la stablecoin USDH de Hyperliquid y prevé una fase de prueba "en cuestión de días"

Native Markets, un equipo del ecosistema Hyperliquid, resultó ganador en un proceso de licitación competitivo por el ticker USDH en el exchange de perpetuos y planea lanzar una stablecoin. Numerosas grandes empresas de criptomonedas presentaron ofertas por el ticker, desde actores institucionales como Paxos y BitGo hasta empresas nativas de cripto como Ethena y Frax. Native Markets, la primera empresa en presentar una propuesta, fue elegida por una supermayoría de dos tercios de HYPE en staking, y planea lanzar el token en una fase de prueba.

The Block•2025/09/15 05:44

El equipo de Native Markets gana la licitación de la stablecoin USDH de Hyperliquid y prevé una fase de prueba "en cuestión de días"

Nemo Protocol lanza un programa de tokens de deuda para las víctimas del exploit de $2.6 millones

La plataforma DeFi basada en Sui, Nemo, anunció un plan de compensación que implica la distribución de tokens de deuda llamados NEOM. Nemo sufrió un exploit de 2.6 millones de dólares a principios de este mes. Para reembolsar a los usuarios afectados, la plataforma planea asignar los fondos recuperados junto con partes de préstamos de liquidez e inversiones a un fondo de redención.

The Block•2025/09/15 05:44

Nemo Protocol lanza un programa de tokens de deuda para las víctimas del exploit de $2.6 millones

Las ganancias de Gumi en cripto se disparan a pesar de la caída en las ventas de juegos

Gumi informó un fuerte repunte en las ganancias del primer trimestre impulsado por los beneficios de las criptomonedas, mientras que los ingresos de juegos móviles cayeron significativamente debido a la reestructuración y a un cambio hacia proyectos de blockchain y títulos de propiedad intelectual de terceros.

BeInCrypto•2025/09/15 05:12

Las ganancias de Gumi en cripto se disparan a pesar de la caída en las ventas de juegos

El repunte del mercado cripto enfrenta la prueba del FOMC: ¿Continuará el impulso esta semana?

Los mercados de criptomonedas experimentaron un esperado repunte la semana pasada, ya que los datos de inflación a la baja alimentaron las esperanzas de un recorte de tasas por parte de la Fed. El sentimiento positivo estuvo liderado por altcoins como Solana y Ethereum.

BeInCrypto•2025/09/15 05:12