... | 🕐 --:--

عاجل

⚡ عاجل: كريستيانو رونالدو يُتوّج كأفضل لاعب كرة قدم في العالم ● ⚡ أخبار عاجلة تتابعونها لحظة بلحظة على خبر ● ⚡ تابعوا آخر المستجدات والأحداث من حول العالم ●

AI مباشر

428386 مقال 250 مصدر نشط 79 قناة مباشرة 2302 خبر اليوم

آخر تحديث: منذ 0 ثانية

Faulty reward functions in the wild

تكنولوجيا

OpenAI Blog

2016/12/21 - 08:00 505 مشاهدة

Reinforcement learning algorithms can break in surprising, counterintuitive ways. In this post we’ll explore one failure mode, which is where you misspecify your reward function.

قراءة المقال الأصلي

مقالات ذات صلة

البيت الأبيض يطلق موقعا إلكترونيا يعنى ظاهريا بالمخلوقات الفضائية على عكس حقيقته

منذ 58 دقيقة

فيفو تطلق سلسلة Vivo S60 ببطارية عملاقة وتقنيات تصوير مبتكرة

منذ ساعة

Présidentielle 2027: "Mes adversaires sont la France Insoumise et le Rassemblement national", affirme Gabriel Attal lors de son meeting

منذ ساعة

يا هلا! اسألني أي شي 🎤

FREE Free 1GB Internet + Free International Calls

$1 trial — eSIM in 190+ countries — No roaming charges

Download Free

Faulty reward functions in the wild

مقالات ذات صلة

كيفية تنزيل مقاطع الفيديو دفعة واحدة باستخدام هاتف شاومي

Microsoft is threatening legal action for disclosing exploits

الولايات المتحدة وبريطانيا وأستراليا تطور تكنولوجيا المسيّرات تحت الماء

البيت الأبيض يطلق موقعا إلكترونيا يعنى ظاهريا بالمخلوقات الفضائية على عكس حقيقته

فيفو تطلق سلسلة Vivo S60 ببطارية عملاقة وتقنيات تصوير مبتكرة

Présidentielle 2027: "Mes adversaires sont la France Insoumise et le Rassemblement national", affirme Gabriel Attal lors de son meeting