🕐 --:--
-- --
عاجل
⚡ عاجل: كريستيانو رونالدو يُتوّج كأفضل لاعب كرة قدم في العالم ⚡ أخبار عاجلة تتابعونها لحظة بلحظة على خبر ⚡ تابعوا آخر المستجدات والأحداث من حول العالم
⌘K
AI مباشر
428386 مقال 250 مصدر نشط 79 قناة مباشرة 2302 خبر اليوم
آخر تحديث: منذ 0 ثانية

Faulty reward functions in the wild

تكنولوجيا
OpenAI Blog
2016/12/21 - 08:00 505 مشاهدة
Reinforcement learning algorithms can break in surprising, counterintuitive ways. In this post we’ll explore one failure mode, which is where you misspecify your reward function.
مشاركة:

مقالات ذات صلة

AI
يا هلا! اسألني أي شي 🎤
FREE Free 1GB Internet + Free International Calls

$1 trial — eSIM in 190+ countries — No roaming charges

Download Free