المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
@EurekaLabsAI المباني. سابقا مدير الذكاء الاصطناعي @ Tesla ، الفريق المؤسس @ OpenAI ، CS231n / PhD @ ستانفورد. أحب تدريب الشبكات العصبية العميقة الكبيرة.
مهتم جدا بما قد تبدو عليه حقبة البرمجيات المصممة خصيصا بشكل كبير.
مثال من هذا الصباح - أصبحت متعبا قليلا مع تمارين القلب مؤخرا، فقررت أن أجري تجربة أكثر تنظيما وتنظيما لمحاولة خفض معدل ضربات القلب أثناء الراحة من 50 إلى > 45، خلال مدة التجربة التي تبلغ 8 أسابيع. الطريقة الأساسية لتحقيق ذلك هي أن تطمح لتحقيق مجموع معين من الأهداف الدقيقة في منطقة 2 للكارديو وHIIT واحد في الأسبوع.
بعد ساعة قمت ببرمجة لوحة تحكم مخصصة جدا لهذه التجربة المحددة التي تظهر لي كيف أتتبع. اضطر كلود إلى عكس هندسة واجهة برمجة تطبيقات السحابة Woodway لسحب البيانات الخام، والمعالجة، والتصفية، وتصحيحها، وإنشاء واجهة واجهة ويب لتتبع التجربة. لم تكن التجربة سلسة تماما واضطررت لملاحظة وطلب إصلاح أخطاء، مثل أن المشكلة في نظام النظام المتري مقابل النظام الإمبراطوري وأخطأت في التقويم عند مطابقة الأيام مع التواريخ، إلخ.
لكنني ما زلت أشعر أن الاتجاه العام واضح:
1) لن يكون هناك (ولا ينبغي أن يكون هناك) تطبيق محدد في متجر التطبيقات لهذا النوع من الأمور. لا يجب أن أبحث عن أو تحميل أو استخدام نوع من "متتبع تجارب القلب"، عندما يكون هذا الشيء عبارة عن ~300 سطر من الكود الذي سيعطيك إياه وكيل LLM خلال ثوان. فكرة "متجر التطبيقات" الذي يحتوي على مجموعة طويلة من التطبيقات المنفصلة التي تختار منها تبدو خاطئة وقديمة بعض الشيء بينما يمكن لوكلاء نماذج اللغة الكبيرة ابتكار التطبيق في اللحظة وبشكل خاص لك.
2) ثانيا، يجب على الصناعة إعادة التكوين لتصبح مجموعة من خدمات الحساسات والمشغلات ذات بيئة بيئة طبيعية للوكيل. جهاز المشي الخاص بي من Woodway هو حساس - يحول الحالة الفيزيائية إلى معرفة رقمية. لا ينبغي أن يحافظ على واجهة أمامية يمكن للبشر قراءتها، ولا يجب أن يضطر وكيل نموذج اللغة الكبيرة الخاص بي إلى عكس هندستها، بل يجب أن يكون API أو CLI يمكن للوكيل استخدامه بسهولة. أنا محبط قليلا (وجداول زمنياتي أبطأ بالمقابل) من بطء هذا التقدم في الصناعة بشكل عام. 99٪ من المنتجات/الخدمات لا تزال لا تحتوي على واجهة تحكم أصلية للذكاء الاصطناعي بعد. 99٪ من المنتجات/الخدمات تحتفظ بمستندات .html/.css بحيث لا أبحث فورا عن كيفية نسخ كل شيء ليعمل على وكيلي لإنجاز شيء. يعطونك قائمة تعليمات على صفحة ويب لفتح هذا أو ذاك الرابط والنقر هنا أو هناك للقيام بأي شيء. في عام 2026. ما أنا كمبيوتر؟ أنت افعلها. أو أن يقوم وكيلي بذلك.
على أي حال، اليوم أنا مندهش أن هذا الشيء العشوائي استغرق ساعة واحدة (كان سيكون ~10 ساعات قبل سنتين). لكن ما يثيرني أكثر هو التفكير في كيف كان يجب أن يكون هذا الفيلم دقيقة واحدة كحد أقصى. ما الذي يجب أن يكون في مكانه ليكون دقيقة واحدة؟ حتى أتمكن ببساطة من قول "مرحبا، هل يمكنك مساعدتي في تتبع تمارين القلب خلال الأسابيع الثمانية القادمة"، وبعد جلسة أسئلة وأجوبة قصيرة جدا كان التطبيق متاحا. الذكاء الاصطناعي سيكون لديه بالفعل الكثير من السياق الشخصي، سيجمع البيانات الإضافية اللازمة، سيقوم بالإشارة والبحث في مكتبات المهارات المتعلقة بها، وصيانة جميع التطبيقات والأتمتة الصغيرة الخاصة بي.
ملخص: "متجر التطبيقات" لمجموعة من التطبيقات المنفصلة التي تختار منها هو مفهوم قديم بشكل متزايد بحد ذاته. المستقبل هو خدمات من أجهزة الاستشعار والمشغلات الأصلية بالذكاء الاصطناعي التي يتم تنسيقها عبر دمج نماذج اللغة الكبيرة في تطبيقات مخصصة ومؤقتة للغاية. لكنها لم تصل بعد.

117
أعتقد أنه يجب أن يكون وقتا مثيرا للاهتمام لتكون في لغات البرمجة والأساليب الرسمية لأن نماذج اللغة الكبيرة تغير تماما مشهد القيود البرمجية. يمكن رؤية تلميحات لهذا الأمر بالفعل، مثل الزخم المتزايد وراء نقل C إلى Rust أو الاهتمام المتزايد بترقية قواعد الشيفرة القديمة في COBOL أو غيرها. على وجه الخصوص، نماذج اللغة الكبيرة *بشكل خاص* جيدة في الترجمة مقارنة بتوليد النماذج الجديدة لأن 1) قاعدة الكود الأصلية تعمل كنوع من التوجيه المفصل للغاية، و2) كمرجع لكتابة اختبارات ملموسة بالنسبة ل. مع ذلك، حتى لغة Rust ليست مثالية لنماذج اللغة الكبيرة كلغة مستهدفة. ما نوع اللغة الأمثل؟ ما هي التنازلات (إن وجدت) التي لا تزال منحوتة للبشر؟ أسئلة وفرص جديدة مثيرة للاهتمام للغاية. يبدو أننا سننتهي بإعادة كتابة أجزاء كبيرة من كل البرامج التي كتبت على الإطلاق مرات عديدة.
115
مبروك على الإطلاق @simile_ai! (وأنا متحمس لأن أكون جزءا من الملاك الصغير.)
تشبيه يعمل على بعد مثير للاهتمام حقا، برأيي لم يتم استكشافه بشكل كاف من نماذج اللغة الكبيرة. عادة، النماذج الكبيرة التي تتحدث معها لها شخصية واحدة محددة ومصطنعة. لكن من حيث المبدأ، الشكل الأصلي والبدائي لنموذج اللغة الكبير المدرب مسبقا هو أنه محرك محاكاة مدرب على نصوص مجموعة متنوعة جدا من الناس على الإنترنت. لماذا لا تعتمد على هذه القوة الإحصائية: لماذا نحاكي "شخصا" واحدا بينما يمكنك محاولة محاكاة سكان؟ كيف تبني مثل هذا المحاكي؟ كيف تدير إنتروبياها؟ ما مدى وفاؤه؟ كيف يمكن أن يكون مفيدا؟ ما هي الخصائص الناشئة التي قد تنشأ من التشبيه في الحلقات؟
برأيي، هذه مواضيع مثيرة للاهتمام وواعدة وغير مستكشفة بشكل كاف، والفريق هنا رائع. كل التوفيق!

Joon Sung Park13 فبراير، 03:00
نقدم لكم سيميل.
محاكاة السلوك البشري هي واحدة من أكثر المشكلات أهمية وصعوبة تقنيا في عصرنا.
جمعنا 100 مليون دولار من إندكس، هانابي، A* BCV، @karpathy @drfeifei @adamdangelo @rauchg @scottbelsky وغيرها.
106
الأفضل
المُتصدِّرة
التطبيقات المفضلة
