تاریخ:

۱۵ آذر ۱۴۰۴

به روز شده در: ۱۵ آذر ۱۴۰۴ - ۱۳:۳۸

۴ کشور اروپایی مسابقات یوروویژن را به دلیل حضور اسرائیل تحریم کردند

برج خلیفه امارات در یک نگاه+ اینفوگرافی

معاون وزارت اقتصاد: با افزایش شفافیت مالی، قدرت تصمیم‌گیری بیشتر می‌شود

فیلم بیشتر »»

حادثه عجیب برای یک گوزن؛ شاخ در کاسه چشم (فیلم)

مراحل بازسازی و مونتاژ تانک‌های آبرامز در کارخانه‌های نظامی آمریکا (فیلم)

در حاشیه

ورود پسر امیر جعفری به دنیای مد؛ آیین جعفری در قاب‌های جدید مدلینگ (+عکس)

«خانومی» بازیگر «کج‌پیله» کیست؟ ماچ و بوسه الناز شاکردوست و نعیمه نظام دوست در اکران (عکس)

مریم مومن عروس شد/ فیلم منتشر شده از عروسی خانم بازیگر

قدم زدن فرشته حسینی در خیابان‌های بارانی استانبول (عکس)

قاب آخر بهنوش طباطبایی در آینه؛ تمدید گریم نانسی برای آخرین اجرا (+عکس)

100 سالگی

طرفداران پرسپولیس با تابلوی عدد ۶ سکوهای ورزشگاه را پر کردند! +عکس

قدیمی‌ترین مرکز خرید تهران در خیابان شاه افتتاح شد! +عکس

با ۸ میلیون تماس تلفنی روزانه، کم‌حرف‌ترین و حرّاف‌ترین مردم کشور مشخص شدند

عکس‌هایی از تهران، اصفهان، همدان و اراک زیر برف!

عکس‌های دیده نشده از علی پروین و ناصر حجازی در آزمایشگاه!

باشگاه مغز

سریع ترین زمان حل این معما 10 ثانیه بوده؛ شما چه رکوردی را ثبت می کنید؟!

یک بستنی متفاوت را گم کرده ایم/ آیا می توانید زیر 5 ثانیه رکورد بزنید؟! (معمای تصویری)

یک معمای ریاضی داریم که خیلی هم سخت نیست، امتحان کنید

معمای پیر مرد کور در جزیره

چقدر تیزبین و سریع هستید؟!/ تخم مرغ های پنهان را بیابید!

باهوش ها، یک معما منتظر شماست!

معمای ریاضی با یک جای خالی

صفحه نخست » فناوری

کد خبر ۱۱۱۸۶۶۶

‍‍‍ پ پ ‍‍‍

تاریخ انتشار: ۰۷:۵۵ - ۰۹-۰۹-۱۴۰۴

‌گزارش خطا در خبر

صفحه نخست » فناوری

کد ۱۱۱۸۶۶۶

انتشار: ۰۷:۵۵ - ۰۹-۰۹-۱۴۰۴

میزان توهم زدن مدل‌های هوش مصنوعی بر اساس پاسخ‌های نادرست یا ناقص (+ اینفوگرافی)

بالا‌ترین نرخ توهم هوش مصنوعی مربوط به Grok‑۳ با ۹۴ درصد بود، به این معنی که تقریباً تمام پاسخ‌های آن اشتباه بودند.

بسیاری از مدل‌های هوش مصنوعی امروز هنگام شناسایی و استناد به منابع خبری از یک متن، دچار مشکل شده و خطاهای زیادی تولید می‌کنند.

به گزارش روزیاتو، بالا‌ترین نرخ توهم هوش مصنوعی مربوط به Grok‑۳ با ۹۴ درصد بود، به این معنی که تقریباً تمام پاسخ‌های آن اشتباه بودند.

آیا هوش مصنوعی شما همیشه پاسخ درست می‌دهد؟ متأسفانه، «حقیقت» ارائه شده توسط آن ممکن است توهم باشد.

این اینفوگرافی، نرخ توهمات هوش مصنوعی را بر اساس مدل‌ها نشان می‌دهد.

توهم هوش مصنوعی چیست؟

«توهم هوش مصنوعی» به مواردی گفته می‌شود که در آن مدل زبانی اطلاعات نادرست یا بدون منبع را به عنوان حقیقت به کاربر ارائه می‌دهد.

این توهمات به این دلیل اتفاق می‌افتند که سیستم‌های آموزش استاندارد، حدس زدن را به جای نشان دادن عدم اطمینان، پاداش می‌دهند. تصور کنید که در یک تست چندگزینه‌ای حدس بزنید؛ احتمال اینکه درست باشد بیشتر از زمانی است که هیچ پاسخی ندهید.

نرخ توهمات هوش مصنوعی: بهترین و بدترین مدل‌ها

برای اندازه‌گیری نرخ توهمات، محققان مدل‌های شرکت‌های پیشرو در حوزه هوش مصنوعی را با متون خبری آزمایش کردند و از آن‌ها خواستند مقاله، رسانه و URL اصلی را مشخص کنند.

نکته مهم اینکه محققان، متونی را انتخاب کردند که اگر در گوگل جستجو شوند، منبع اصلی در سه نتیجه اول ظاهر می‌شود.

سپس پاسخ‌های مدل‌های هوش مصنوعی برای دقت بررسی شدند. جدول زیر نشان می‌دهد هر مدل چند درصد پاسخ نادرست یا ناقص داده است:

مدل هوش مصنوعی	نرخ توهم
Perplexity	۳۷ درصد
Copilot	۴۰ درصد
Perplexity Pro	۴۵ درصد
ChatGPT Search	۶۷ درصد
Deepseek Search	۶۸ درصد
Gemini	۷۶ درصد
Grok-2 Search	۷۷ درصد
Grok-3 Search	۹۴ درصد

Grok‑۳ بدترین عملکرد را داشت و ۹۴ درصد پاسخ‌هایش توهم بود، در حالی که Perplexity دقیق‌ترین پاسخ‌ها را ارائه کرد.

نکته جالب اینکه مدل‌های پولی حتی در مواردی از نسخه‌های رایگان ضعیف‌تر عمل کردند. اکثر مدل‌ها نیز، باوجود خطاهای زیاد، هیچ نشانه‌ای از عدم اطمینان در پاسخ‌هایشان نشان ندادند.

پربیننده ترین پست همین یک ساعت اخیر

خداحافظی «پدر راک ایران»؛ کوروش یغمایی دنیای موسیقی را ترک گفت (+ خواب ستاره)

خبر بعد نظرات کاربران خبر قبل

اشتراک گذاری :

کانال عصر ایران در تلگرام

۴ کشور اروپایی مسابقات یوروویژن را به دلیل حضور اسرائیل تحریم کردند

بیشتر بخوانید:

هوش مصنوعی و پیش‌بینی زمان تقریبی مرگ

هوش مصنوعی افکار را به جمله تبدیل می‌کند

«هوش مصنوعی» قدرت تولید کدام کشورها را بیشتر می‌کند؟ (اینفوگرافیک)

تماشاخانه