57 درصد از محتوای اینترنتی توسط هوش مصنوعی ایجاد می شود

57 درصد از محتوای اینترنتی توسط هوش مصنوعی ایجاد می شود

تحقیقات جدیدی که توسط محققان شرکت خدمات وب آمازون انجام شده است (اوس) این نشان می دهد که 57 درصد از محتوای فعلی اینترنت توسط هوش مصنوعی یا ترجمه ماشینی تولید می شود. محققان می گویند یکی از بزرگترین قربانیان این مشکل خود مدل های هوش مصنوعی هستند که از داده های آنلاین برای آموزش استفاده می کنند.

برای گزارش دادن فوربستحقیقات انجام شده توسط محققین خدمات وب آمازون (AWS) به نظر می رسد که بیش از نیمی از محتوای اینترنتی توسط انسان تولید نمی شود. در این میان، سیستم‌های ترجمه ماشینی خودکار که متن را از یک زبان مرجع (عمدتا انگلیسی) به چندین زبان دیگر ترجمه می‌کنند، یکی از دلایل اصلی این مشکل هستند:

ترجمه های ماشینی نه تنها اکثریت محتوای ترجمه شده در زبان های کمتر رایج را تشکیل می دهند، بلکه اغلب سهم بزرگی از کل محتوای آن زبان ها را نشان می دهند.

محققان همچنین می گویند که در انتخاب محتوا برای ترجمه های ماشینی سوگیری وجود دارد به طوری که بیشتر محتوای ترجمه شده کوتاه و قابل پیش بینی است و علاوه بر این، توزیع موضوعات انتخاب شده برای ترجمه ماشینی نیز تفاوت اساسی با محتوای ترجمه شده توسط انسان دارد.

ترجمه ماشینی مغرضانه است

فروپاشی مدل های هوش مصنوعی

جالب ترین نکته این است که با افزایش تعداد محتوای تولید شده توسط هوش مصنوعی و همچنین استفاده از هوش مصنوعی برای ویرایش و تغییر محتوای تولید شده توسط انسان، این امر می تواند منجر به پدیده ای به نام فروپاشی مدل یا فروپاشی مدل شود. سقوط مدل این مشکل قبلاً منجر به کاهش کیفیت خروجی مدل‌های هوش مصنوعی شده است.

  بررسی آیفون 15 و 15 پلاس اپل: برای خوب بودن لازم نیست پرچمدار باشد

سقوط مدل

فروپاشی مدل پدیده عجیبی است که در آن آموزش مدل‌های هوش مصنوعی بر روی داده‌های تولید شده توسط هوش مصنوعی منجر به کاهش کیفیت یا حتی غیرقابل استفاده بودن خروجی تولید شده توسط مدل‌های هوش مصنوعی تولیدی می‌شود.

این پدیده می‌تواند اینترنت را پر از محتوای هوش مصنوعی کند و به چالشی جدی برای مدل‌های زبانی محبوب مانند ChatGPT، دوقلو و کلود تغییر می کند زیرا این مدل ها به حجم وسیعی از محتوای موجود آنلاین برای آموزش متکی هستند و پر ، فضای وب با محتوای غیر بومی می تواند به سرعت عملکرد مدل های زبان را کاهش دهد.

محتوای تولید شده با هوش مصنوعی را پرچم گذاری کنید

قبل از این، تلاش هایی برای تسهیل محتوای تولید شده توسط هوش مصنوعی انجام شد که هدف اصلی آن حفاظت از مالکیت معنوی و جلوگیری از استفاده نامناسب از این محصولات هوش مصنوعی بود. نتایج این تحقیق می تواند دلیل جدیدی برای محدود ، محتوای هوش مصنوعی در وب باشد تا از بازیافت این اطلاعات برای آموزش مدل های هوش مصنوعی جلوگیری شود.

در این رابطه بخوانید:

– از طریق این روش، “تمرینات” نوشته شده با استفاده از ChatGPT را می توان شناسایی کرد. اما OpenAI علاقه ای به انتشار آن ندارد
– حفاظت از مالکیت معنوی در دنیای هوش مصنوعی: یک استارتاپ جدید منشا داده های هوش مصنوعی را فاش می کند.

نتایج تحقیقات Os می توانید آن را در این لینک بخوانید.

نظر شما در مورد این مشکل جدید چیست؟ آیا راه حلی برای جلوگیری از پر شدن اینترنت با محتوای بی کیفیت هوش مصنوعی می دانید؟

  حقایق جالب در مورد سیستم مورد استفاده کاربران Steam که هر گیمری باید بداند

منبع: https://www.shahrsakhtafzar.com/fa/news/52491-most-of-internete-content-is-ai-generated