هل يمكنك تشغيل الذكاء الاصطناعي المحلي على جهاز تخزين شبكي منزلي بدون وحدة معالجة رسومات مخصصة؟

إيفا وونغ هي كاتبة تقنية و ومهندسة هاوية في ZimaSpace. مهووسة بالتكنولوجيا مدى الحياة ولديها شغف بالمختبرات المنزلية والبرمجيات مفتوحة المصدر، تتخصص في تبسيط المفاهيم التقنية المعقدة إلى أدلة عملية وسهلة الفهم. تؤمن إيفا بأن الاستضافة الذاتية يجب أن تكون ممتعة وليست مخيفة. من خلال دروسها، تمكّن المجتمع من تبسيط إعدادات الأجهزة، بدءًا من بناء أول نظام تخزين شبكي NAS وحتى إتقان حاويات Docker.

يمكن لجهاز NAS منزلي تشغيل بعض أعباء عمل الذكاء الاصطناعي المحلي بدون معالج رسومي مخصص، لكن السؤال المفيد ليس فقط ما إذا كان النموذج يبدأ. السؤال الحقيقي هو ما إذا كان عبء العمل يناسب معالجك المركزي، والذاكرة المتاحة، وحجم النموذج، والمهام التخزينية، وصبرك على وقت الاستجابة.

بالنسبة للعديد من المستخدمين المنزليين، جهاز NAS بدون معالج رسومي هو مكان معقول لتجربة النماذج الصغيرة، والتضمينات، والبحث المحلي، وسير العمل الخاص بأسلوب RAG. يصبح أقل عملية عندما يتوقع المهمة دردشة في الوقت الحقيقي مع نماذج أكبر، أو توليد صور كثيف، أو استدلال طويل السياق، أو مهام ذكاء اصطناعي خلفية تعمل في نفس الوقت مع النسخ الاحتياطية، أو فهرسة الوسائط، أو نقل الملفات.

موجز سريع: عدم وجود معالج رسومي مخصص لا يعني عدم وجود حدود

نعم، يمكنك تشغيل الذكاء الاصطناعي المحلي على جهاز NAS منزلي بدون معالج رسومي مخصص، خاصة إذا استخدمت نماذج صغيرة أو كمية وعاملت جهاز NAS كصندوق ذكاء اصطناعي محلي منخفض الطاقة بدلاً من محطة عمل عالية السرعة. يمكن أن يكون إعداد المعالج المركزي فقط مفيدًا للتجارب، والدردشة الخفيفة، والبحث المحلي في الوثائق، والتضمينات، والفهرسة الخلفية.

الحد هو قابلية الاستخدام. قد يتم تحميل نموذج تقنيًا لكنه لا يزال يستجيب ببطء شديد، أو يستهلك الكثير من الذاكرة، أو يجعل جهاز NAS بطيئًا أثناء خدمته للملفات، أو تشغيل الحاويات، أو التعامل مع النسخ الاحتياطية، أو بث الوسائط.

المفهوم الخاطئ الذي يجب تجنبه بسيط: عدم وجود معالج رسومي مخصص لا يعني عدم وجود حدود للأجهزة. بدون تسريع المعالج الرسومي، يعتمد جهاز NAS بشكل كبير على خيوط المعالج المركزي، وذاكرة النظام، وسرعة التخزين، وجدولة أعباء العمل.

ما يمكن للذكاء الاصطناعي المحلي فعله بشكل واقعي على جهاز NAS منزلي

جهاز NAS منزلي بدون معالج رسومي مخصص يكون عادة أفضل في الأعمال الخفيفة أو الخلفية للذكاء الاصطناعي مقارنة بالتوليد التفاعلي عالي السرعة. أفضل أعباء العمل للبدء بها هي التي تكون صغيرة بما يكفي لتناسب الذاكرة بشكل مريح وتتسامح مع أوقات استجابة أبطأ. يشمل ذلك البحث المحلي، التضمينات، نماذج الدردشة الصغيرة، فهرسة الوثائق، التلخيص البسيط، وتجارب قواعد المعرفة الخاصة.

أولاما هو مثال عملي لأن وثائقه تتضمن مسار دوكر للمعالج المركزي فقط بالإضافة إلى خيارات منفصلة تتعلق بالمعالج الرسومي. هذا لا يعني أن استدلال المعالج المركزي سيكون سريعًا على كل جهاز NAS. يعني فقط أن استضافة نموذج محلي يعمل على المعالج المركزي فقط هي مسار بداية صالح عندما يكون النموذج والتوقعات صغيرة بما فيه الكفاية.

هذا التمييز مهم لأن "الذكاء الاصطناعي المحلي" يشمل أعباء عمل مختلفة تمامًا. طرح أسئلة قصيرة على نموذج بحجم 1 مليار إلى 3 مليارات ليس هو نفسه تشغيل نموذج بحجم 70 مليار، أو توليد صور، أو نسخ أرشيف كبير، أو بناء فهرس دلالي عبر سنوات من الصور والفيديوهات.

عنق الزجاجة الحقيقي: وحدة المعالجة المركزية، والذاكرة، وحجم النموذج، ومهام NAS الخلفية

الاستدلال بوحدة المعالجة المركزية

الاستدلال بوحدة المعالجة المركزية هو المسار الأساسي لجهاز NAS بدون وحدة معالجة رسومات مخصصة. يمكن أن يعمل، لكنه عادة ما يشعر بأنه أبطأ من الذكاء الاصطناعي السحابي أو وحدة معالجة الرسومات المكتبية. يجب على وحدة المعالجة المركزية التعامل مع توليد الرموز بينما قد يدير جهاز NAS أيضًا مشاركات الملفات، وتطبيقات Docker، ومسح الوسائط، وخدمات النظام.

يمكن لوحدة معالجة مركزية حديثة مع دعم تعليمات أفضل أن تجعل النماذج الصغيرة أكثر احتمالًا، لكنها لا تغير التوازن الأساسي. كلما زاد عدد المستخدمين النشطين، والحاويات، وعمليات الملفات، وطلبات الذكاء الاصطناعي التي تجمعها معًا، زادت احتمالية أن يصبح جهاز NAS عنق الزجاجة.

ذاكرة النظام

بدون ذاكرة فيديو (VRAM)، يعتمد الذكاء الاصطناعي المحلي بشكل كبير على ذاكرة النظام. النموذج، ووقت التشغيل، وواجهة الويب، والتضمينات، وخدمات الملفات، وحاويات Docker، ونظام التشغيل كلها تتنافس على نفس تجمع الذاكرة. إذا دفع النموذج النظام إلى التبديل المكثف، يمكن أن تنهار التجربة بسرعة.

لهذا السبب تهم الذاكرة الحرة أكثر من إجمالي الذاكرة المثبتة على الورق. قد يكون جهاز NAS بسعة 16 جيجابايت من ذاكرة الوصول العشوائي ضيقًا إذا كانت عدة حاويات Docker، وأدوات الوسائط، ووظائف المزامنة، وخدمات الملفات نشطة بالفعل. قبل تحميل نموذج، تحقق من مقدار الذاكرة المتبقية أثناء الاستخدام العادي لجهاز NAS، وليس فقط بعد إعادة التشغيل.

حجم النموذج والتكميم

حجم النموذج غالبًا ما يكون العامل الحاسم. النماذج الأصغر تُحمّل أسرع، وتستخدم ذاكرة أقل، وأكثر واقعية لتجارب وحدة المعالجة المركزية فقط. النماذج الأكبر قد تبدأ تقنيًا لكنها تصبح محبطة إذا استغرق كل رد وقتًا طويلاً.

هنا تكمن أهمية التكميم الصحيح. يصف llama.cpp مستويات التكميم التي تقلل من استخدام الذاكرة ويمكن أن تحسن سرعة الاستدلال، ولهذا تعتمد العديد من إعدادات الذكاء الاصطناعي المحلية الصديقة لوحدة المعالجة المركزية على نماذج GGUF المكممة. الدرس العملي هو ليس "استخدم أكبر نموذج يمكنك تحميله"، بل "استخدم أصغر نموذج يكفي للمهمة".

أي أحمال عمل الذكاء الاصطناعي تناسب جهاز NAS بدون وحدة معالجة رسومات بشكل أفضل

نماذج الدردشة الخفيفة والصغيرة

نماذج الدردشة الصغيرة هي أسهل طريقة لاختبار ما إذا كان جهاز NAS الخاص بك يمكنه التعامل مع الذكاء الاصطناعي المحلي على الإطلاق. فهي مفيدة للمطالبات القصيرة، والمسودات البسيطة، وشرح الأوامر، والمساعدة الأساسية في البرمجة، أو التجارب المحلية. الهدف ليس مطابقة نموذج سحابي عالي المستوى؛ الهدف هو التأكد مما إذا كان جهاز NAS يمكنه تقديم سرعة استجابة يمكنك تحملها.

ابدأ بنموذج أصغر قبل زيادة الحجم. إذا جعل الاختبار الأول جهاز NAS بطيئًا بالفعل، فلن يحل النموذج الأكبر المشكلة. إذا كان النموذج الصغير مقبولًا، يمكنك بعد ذلك اختبار نماذج أكبر قليلاً أو نماذج محسنة أثناء مراقبة تحميل وحدة المعالجة المركزية، وضغط الذاكرة، ووقت الاستجابة.

التضمينات، الفهرسة، وRAG الخاص

يمكن أن تكون التضمينات وRAG الخاص أفضل ملاءمة لجهاز NAS لأن الحمل غالبًا ما يكون مناسبًا للخلفية. يخزن جهاز NAS بالفعل المستندات والملاحظات والصور والوسائط والأرشيفات، لذا فإن الفهرسة المحلية منطقية عندما تكون الخصوصية وموقع الملف مهمين. لا تزال المهمة تحتاج إلى موارد، لكنها لا تتطلب دائمًا توليد رموز مباشر بسرعة الدردشة.

الخطر الرئيسي هو الجدولة. إذا بدأ الفهرسة أثناء النسخ الاحتياطية أو فحص الوسائط أو نقل الملفات، قد يشعر جهاز NAS بالبطء حتى لو كانت مهمة الذكاء الاصطناعي تعمل تقنيًا. لهذا النوع من الأحمال، غالبًا ما يكون من الأفضل تشغيل الفهرسة خلال ساعات الهدوء واختبار مدى تأثيرها على الوصول العادي للملفات.

البحث بالذكاء الاصطناعي للملفات والوسائط المحلية

البحث بالذكاء الاصطناعي هو أحد أكثر حالات استخدام NAS طبيعية لأنه يربط التخزين المحلي بالفهم المحلي. بدلاً من التعامل مع NAS كمحطة عمل ذكاء اصطناعي عامة، تساعد طبقة الذكاء الاصطناعي في تصنيف أو بحث أو استرجاع الملفات التي تعيش بالفعل على الجهاز.

هنا أيضًا يجب أن تكون التوقعات واضحة. قد يتضمن البحث بالذكاء الاصطناعي تنزيل النماذج، واستخراج الميزات، والمعالجة في الخلفية، وارتفاعات دورية في الموارد. عادةً ما لا يكون الأمر نفسه كما لو طلبت من روبوت محادثة الإجابة فورًا من نموذج كبير.

ما يجب تجنبه على أجهزة NAS التي تعمل بوحدة معالجة مركزية فقط

عادةً ما يكون جهاز NAS الذي يعمل فقط بوحدة المعالجة المركزية غير مناسب لتوليد الصور الثقيلة، والدردشة الحية بالنماذج الكبيرة، والتفكير في سياق طويل، وتعدد المستخدمين المتزامنين للذكاء الاصطناعي. يمكن أن تستهلك هذه الأحمال الكثير من الذاكرة، وتشبع خيوط وحدة المعالجة المركزية، وتتداخل مع الوظيفة الأساسية لجهاز NAS.

يجب عليك أيضًا تجنب تشغيل مهام الذكاء الاصطناعي التجريبية أثناء العمل الحرج على التخزين. إذا كان جهاز NAS يعيد بناء التخزين، أو يزامن النسخ الاحتياطية السحابية، أو يفهرس الوسائط، أو يبث الفيديو، أو يتعامل مع نقل ملفات مهم، فإن إضافة استدلال ثقيل فوق ذلك يمكن أن يجعل استكشاف الأخطاء وإصلاحها أصعب. يجب أن يكون إعداد الذكاء الاصطناعي المحلي الآمن اختياريًا وقابلًا للإيقاف، وليس شيئًا يعرض مهام التخزين الأساسية للخطر.

تجنب هذه الأنماط في الاختبار الأول:

  • البدء بنموذج كبير لمجرد أنه شائع.
  • تشغيل عدة حاويات ذكاء اصطناعي قبل اختبار مسار مستقر واحد.
  • عرض واجهة ويب على الشبكة قبل التحقق من المصادقة ونطاق الوصول.
  • السماح لفهرسة الذكاء الاصطناعي بالعمل في نفس الوقت مع النسخ الاحتياطية أو فحص الوسائط.
  • افتراض أن التثبيت الناجح يعني أن الإعداد قابل للاستخدام للعمل اليومي.

جدول قرار عملي قبل تثبيت أي شيء

قبل تثبيت حزمة ذكاء اصطناعي محلية، قرر ما الذي من المفترض أن يفعله جهاز التخزين الشبكي. عبء العمل الخاطئ يمكن أن يجعل جهاز التخزين الشبكي الجيد يبدو ضعيفًا، بينما عبء العمل الصحيح يمكن أن يجعل جهازًا متواضعًا مفيدًا لتجارب الذكاء الاصطناعي الخاصة.

الإعداد أو عبء العمل استخدم عندما تجنب عندما ما يحدث عادةً
نموذج دردشة محلي صغير على وحدة المعالجة المركزية لجهاز التخزين الشبكي تريد تجربة مع مطالبات قصيرة واستخدام خاص خفيف تتوقع سرعة تشبه السحابة أو جودة نموذج كبير يعمل، لكن سرعة الاستجابة تعتمد بشكل كبير على وحدة المعالجة المركزية وحجم النموذج
التضمينات أو الفهرسة الخاصة RAG ملفاتك موجودة بالفعل على جهاز التخزين الشبكي والمعالجة في الخلفية مقبولة تحتاج إلى فهرسة فورية عبر مكتبة كبيرة خلال ساعات الذروة مفيد للبحث، لكن يجب جدولته ومراقبته
فتح WebUI على جهاز التخزين الشبكي، والنموذج في مكان آخر تريد أن يستضيف جهاز التخزين الشبكي الواجهة بينما يقوم جهاز أقوى بتشغيل الاستدلال تريد كل شيء مدمجًا في جهاز واحد منخفض الطاقة غالبًا ما يكون أفضل من حيث سهولة الاستخدام لأن الحساب منفصل عن مهام التخزين
تسريع باستخدام وحدة معالجة الرسومات المدمجة أو الخارجية يدعم نظام جهاز التخزين الشبكي مسار الأجهزة وبرامج التشغيل لا تريد العمل على برامج التشغيل، أو التمرير، أو التوافق يمكن أن يحسن الاستجابة لكنه يضيف تعقيدًا في الإعداد
توليد الصور أو الدردشة الحية مع نموذج كبير على وحدة المعالجة المركزية تريد فقط إثبات مفهوم ويمكنك الانتظار تحتاج إلى استخدام يومي متكرر، سريع، أو موثوق عادة ما يكون محبطًا على أجهزة التخزين الشبكي التي تعتمد فقط على وحدة المعالجة المركزية

استخدم الجدول كمرشح، وليس كتعهد. إذا كان عبء العمل ينتمي إلى الأعمدة اليسرى ولكنه لا يزال يجعل جهاز التخزين الشبكي بطيئًا، قلل حجم النموذج أو انقل الحساب إلى مكان آخر. إذا كان عبء العمل ينتمي إلى عمود التجنب، فمن الأفضل الاختبار على جهاز مكتبي، أو كمبيوتر صغير، أو وحدة معالجة رسومات خارجية، أو وحدة معالجة رسومات عن بُعد قبل لوم جهاز التخزين الشبكي.

أنماط الإعداد التي تعمل عادةً بشكل أفضل

تشغيل كل شيء على جهاز التخزين الشبكي

تشغيل بيئة النموذج وواجهة الويب على جهاز التخزين الشبكي هو أبسط نموذج ذهني. يحافظ على التكديس الذاتي ويعمل جيدًا للاختبارات الخفيفة. هذا منطقي عندما يكون النموذج صغيرًا، وعدد المستخدمين قليلًا، وجهاز التخزين الشبكي يحتوي على ذاكرة كافية.

الجانب السلبي هو التنافس على الموارد. إذا كانت بيئة تشغيل الذكاء الاصطناعي، وواجهة المستخدم، وخدمات الملفات، والنسخ الاحتياطية، وأدوات الوسائط تشترك جميعها في جهاز واحد، فلن يكون لجهاز التخزين الشبكي مخزن حسابي منفصل. عندما تشعر أن الأداء ضعيف، يكون الحل الأول عادةً ليس واجهة مستخدم أكثر تعقيدًا؛ بل نموذج أصغر، أو تقليل التزامن، أو مسار حسابي مختلف.

استضافة واجهة الويب على جهاز التخزين الشبكي وتشغيل النماذج في مكان آخر

نمط الصندوقين غالبًا ما يكون أكثر عملية. يستضيف NAS واجهة الويب ويخزن البيانات، بينما يشغل جهاز مكتبي أو كمبيوتر صغير أو جهاز قادر على GPU وقت تشغيل النموذج. يدعم Open WebUI إعدادًا يمكنه الاتصال بـ Ollama على خادم آخر، وهو مناسب لهذا النمط جيدًا.

يمكن أن يمنحك هذا سير عمل ذكاء اصطناعي محلي أنظف دون إجبار معالج NAS على القيام بكل عمل الاستدلال. يظل NAS مفيدًا كواجهة دائمة التشغيل وطبقة تخزين، بينما يحدث توليد النموذج الأثقل على أجهزة أكثر ملاءمة لذلك.

استخدم تسريع iGPU أو GPU خارجي عند توفره

بعض منصات NAS تتضمن GPU مدمج أو تدعم التسريع الخارجي. يمكن أن يحسن هذا من قابلية استخدام الذكاء الاصطناعي المحلي، لكنه لا يجب أن يُعامل كأمر تلقائي. دعم التعريفات، وصول الحاوية، توافق الخلفية، مشاركة الذاكرة، ومتطلبات النموذج كلها مهمة.

إذا كان تسريع iGPU متاحًا، اختبره كمسار حساب منفصل بدلاً من افتراض أنه سيتصرف مثل GPU مخصص. راقب نفس الإشارات: سرعة الاستجابة، تحميل المعالج، ضغط الذاكرة، وقت تحميل النموذج، وما إذا كان عمل NAS الطبيعي يظل مستقرًا.

كيفية اختبار الأداء دون تعطيل NAS الخاص بك

يجب أن يثبت الاختبار الجيد أكثر من "تم تشغيل الحاوية". تحتاج إلى معرفة ما إذا كان NAS يظل قابلاً للاستخدام أثناء تحميل النموذج والرد. استخدم نموذجًا صغيرًا واحدًا، مسار واجهة مستخدم واحد، وموجه قابل للتكرار قبل إضافة المزيد من الأدوات.

ابدأ بهذا الترتيب للاختبار:

  1. تحقق من سلوك NAS الطبيعي قبل بدء الذكاء الاصطناعي: تصفح الملفات، لوحة تحكم Docker، مكتبة الوسائط، وحالة النسخ الاحتياطي.
  2. ابدأ وقت تشغيل الذكاء الاصطناعي وحمّل نموذجًا صغيرًا أو مكممًا واحدًا.
  3. اطرح نفس الموجه القصير ثلاث مرات وسجل ما إذا كانت الردود قابلة للاستخدام.
  4. راقب تحميل المعالج، استخدام الذاكرة العشوائية، سلوك التبديل، وسجلات الحاوية.
  5. افتح الملفات أو تصفح مجلدًا مشتركًا أثناء توليد النموذج.
  6. أوقف حاوية الذكاء الاصطناعي وتأكد من عودة NAS إلى الوضع الطبيعي بسرعة.
  7. كرر مع نموذج أكبر قليلاً فقط إذا اجتاز الاختبار الأول.

للاختبار الرسمي أكثر، يتضمن llama.cpp مسار الرموز في الثانية من خلال llama-bench. لا تحتاج إلى تحويل كل اختبار NAS منزلي إلى تقرير مختبر، لكن يجب أن تقيس بما يكفي لتجنب التخمين. إذا كان النظام يبدو بطيئًا، السؤال المفيد هو ما إذا كان الاختناق في حجم النموذج، أو خيوط المعالج، أو ضغط الذاكرة، أو حمل التخزين، أو مهمة NAS أخرى تعمل في نفس الوقت.

يجب أن تجيب الفحص النهائي على خمسة أسئلة:

  • هل سرعة الاستجابة مقبولة للمهمة؟
  • هل تبقى الذاكرة العشوائية مستقرة دون تبديل مكثف؟
  • هل يمكن للملفات، والنسخ الاحتياطية، وخدمات الوسائط أن تعمل بشكل طبيعي؟
  • هل يمكن إيقاف أو جدولة حمل عمل الذكاء الاصطناعي؟
  • هل واجهة الويب محدودة للمستخدمين والشبكات الموثوقة فقط؟

إذا كان أي جواب لا، فالإعداد يحتاج لأن يكون أصغر، أو أكثر عزلة، أو يتم تفريغه.

الأخطاء التي تجعل تجربة الذكاء الاصطناعي المحلية أسوأ مما ينبغي

الخطأ 1: البدء بنموذج كبير جدًا

الخطأ: يبدأ المستخدم بنموذج شائع بحجم 7B أو 13B أو أكبر لأنه يبدو أكثر قدرة.

لماذا يحدث ذلك: غالبًا ما تُكتب توصيات النماذج لأجهزة الكمبيوتر المخصصة للألعاب، ومحطات عمل GPU، أو خوادم السحابة، وليس دائمًا لوحدات المعالجة المركزية منخفضة الطاقة في NAS. قد يبدو النموذج معقولًا في اختبار الأداء لكنه يختلف كثيرًا على جهاز يخدم الملفات أيضًا.

لماذا هو خطير: قد يقضي NAS وقتًا طويلاً في التحميل، أو التبديل، أو التوليد ببطء. قد يجعل ذلك تجربة الذكاء الاصطناعي المحلية الأولى تبدو معطلة حتى لو تم تثبيت البرنامج بشكل صحيح.

البديل الأكثر أمانًا: ابدأ بنموذج صغير مكوّن واختبر سرعة الاستجابة الحقيقية قبل الترقية.

التحقق: إذا استجاب النموذج الصغير بسلاسة وبقي NAS مستجيبًا، اختبر الحجم التالي. إذا تباطأ NAS فورًا، فالنموذج كبير جدًا لهذا الإعداد.

الخطأ 2: اعتبار متطلبات الذاكرة العشوائية اختيارية

الخطأ: يتحقق المستخدم من طراز وحدة المعالجة المركزية لكنه يتجاهل مقدار الذاكرة الحرة المتبقية أثناء استخدام NAS العادي.

لماذا يحدث ذلك: تتحدث العديد من أدلة إعداد الذكاء الاصطناعي عن حجم النموذج لكنها لا تأخذ في الاعتبار تطبيقات Docker، وخدمات الملفات، وأدوات الوسائط، ونظام التشغيل التي تشترك في نفس الذاكرة العشوائية.

لماذا هو خطير: قد يسبب ضغط الذاكرة تباطؤًا، فشل تحميل النموذج، عدم استقرار الحاويات، أو تبديلًا مكثفًا. على خادم التخزين، يمكن أن يؤثر ذلك على أكثر من تطبيق الذكاء الاصطناعي.

البديل الأكثر أمانًا: تحقق من الذاكرة العشوائية المتاحة قبل وأثناء الاستدلال، واترك هامشًا لخدمات NAS العادية.

التحقق: شغّل النموذج أثناء تصفح الملفات ومراقبة استخدام الذاكرة. إذا بدأ النظام في التبديل بشكل مكثف أو تأخرت خدمات أخرى، قلل من حجم النموذج أو انقل الحوسبة إلى مكان آخر.

الخطأ 3: تشغيل مهام الذكاء الاصطناعي الثقيلة أثناء النسخ الاحتياطي أو مهام الوسائط

الخطأ: تشغيل فهرسة الذكاء الاصطناعي، واستدلال الدردشة، ومسح الوسائط، ووظائف النسخ الاحتياطي كلها في نفس الوقت.

لماذا يحدث ذلك: غالبًا ما يتعامل مستخدمو NAS مع المهام الخلفية على أنها غير مرئية حتى تنخفض الأداء. تجعل أحمال عمل الذكاء الاصطناعي هذا الافتراض أكثر هشاشة لأنها قد تسبب ارتفاعًا مفاجئًا في استخدام وحدة المعالجة المركزية، والذاكرة العشوائية، والقرص، أو الشبكة.

لماذا هو محفوف بالمخاطر: قد يصبح NAS بطيئًا أثناء المهام التي من المفترض أن يتعامل معها بشكل موثوق. إذا بدأ استكشاف الأخطاء أثناء النسخ الاحتياطي، يصبح من الصعب تحديد ما إذا كان النموذج الذكي، أو الحاوية، أو تجمع التخزين، أو مهمة النسخ الاحتياطي هو سبب المشكلة.

بديل أكثر أمانًا: جدولة مهام الذكاء الاصطناعي الثقيلة خلال ساعات الهدوء وتجنب إجراء التجارب أثناء الأعمال الحرجة للتخزين.

التحقق: نفذ نفس مهمة الذكاء الاصطناعي خلال فترة هدوء ومرة أخرى أثناء تشغيل الخدمات العادية. إذا تسبب التشغيل الثاني في تعطيل النسخ الاحتياطية أو الوسائط أو الوصول إلى الملفات، فإن عبء العمل يحتاج إلى حدود أو جدولة.

الخطأ 4: الخلط بين "يعمل" و"قابل للاستخدام"

الخطأ: يعتبر المستخدم بدء الحاوية بنجاح أو أول رد للنموذج دليلًا على أن NAS جاهز للذكاء الاصطناعي المحلي اليومي.

لماذا يحدث ذلك: غالبًا ما تتوقف أدلة التثبيت عند أول استجابة ناجحة. الاستخدام الحقيقي مختلف لأن المطالبات تصبح أطول، والملفات تُفهرس، ويتصل عدة مستخدمين، وتتداخل الوظائف الخلفية.

لماذا هو محفوف بالمخاطر: قد يفشل الإعداد الذي يعمل في اختبار قصير واحد أثناء بحث وثائق حقيقي، أو فهرس صور عائلية، أو جلسة دردشة طويلة.

بديل أكثر أمانًا: اختبر جلسة واقعية قبل الاحتفاظ بعبء العمل مفعّلًا.

التحقق: استخدم نفس مهام NAS التي تقوم بها عادة، ثم اختبر سرعة استجابة الذكاء الاصطناعي، وتصفح الملفات، وحمل النظام، ومسار الإيقاف. إذا ظل NAS مستقرًا، فإن عبء العمل مناسب أكثر.

كيف ينطبق هذا على سير عمل البحث بالذكاء الاصطناعي الحقيقي على NAS

يكون الذكاء الاصطناعي المحلي على NAS مفيدًا غالبًا عندما يحسن الملفات المخزنة بالفعل هناك. البحث بالذكاء الاصطناعي مثال جيد لأنه يمكنه تحويل الوسائط والوثائق إلى مكتبة قابلة للبحث، لكنه يوضح أيضًا سبب حاجة الذكاء الاصطناعي المحلي إلى تخطيط الموارد. استخراج الميزات، وتنزيل النماذج، ومسح الوسائط، وفهرسة البحث هي مهام خلفية، وليست مجرد نافذة دردشة.

ينطبق نفس القاعدة في بيئة ZimaOS. تم تصميم وحدة البحث بالذكاء الاصطناعي في ZimaOS لدعم البحث باستخدام الذكاء الاصطناعي المحلي لاستخراج الميزات من الصور والصوت والفيديو، كما تسرد الوثائق مسارات الأجهزة، ومتطلبات الذاكرة، وتخزين النماذج، وتنزيل التبعيات، واستخدام الموارد، وملاحظات استكشاف الأخطاء وإصلاحها. هذا يجعلها مثالًا عمليًا مفيدًا للنقطة الرئيسية في المقال: يمكن تشغيل البحث بالذكاء الاصطناعي المحلي على NAS، لكنه لا يزال يحتاج إلى مسار أجهزة واضح وميزانية موارد.

على جهاز NAS منزلي يركز على التخزين مثل ZimaCube 2 AI NAS، يكون هذا النوع من سير العمل منطقيًا عندما يريد المستخدم بحثًا خاصًا عبر الملفات المحلية بدلاً من الفهرسة السحابية. يمنح الجهاز البيانات موطنًا محليًا، لكن نفس الفحوصات لا تزال تنطبق: حجم النموذج، سعة الذاكرة المتاحة، مسار الحوسبة، جدول الفهرسة، والقدرة على إيقاف أو تقييد عمل الذكاء الاصطناعي عندما تكون خدمات NAS العادية أكثر أهمية.

الأسئلة المتكررة

هل يمكن لجهاز NAS منزلي تشغيل الذكاء الاصطناعي المحلي بدون وحدة معالجة رسومات مخصصة؟

نعم، يمكن لجهاز NAS منزلي تشغيل بعض أعباء عمل الذكاء الاصطناعي المحلي بدون وحدة معالجة رسومات مخصصة. الأنسب عادة هو النماذج الصغيرة أو المنقوصة الدقة، والتضمينات، وRAG الخاص، والبحث المحلي، أو التجارب الخفيفة. يصبح أقل عملية عندما يتوقع المستخدم دردشة سريعة مع نماذج كبيرة، أو توليد صور، أو عدة مستخدمين نشطين.

كم من ذاكرة الوصول العشوائي أحتاج للذكاء الاصطناعي المحلي على جهاز NAS؟

يعتمد ذلك على النموذج، ووقت التشغيل، ونظام التشغيل، وخدمات NAS الأخرى. الطريقة الأكثر أمانًا للحكم هي التحقق من الذاكرة الحرة أثناء استخدام NAS العادي، ثم اختبار نموذج صغير واحد ومراقبة ما إذا كانت الذاكرة تبقى مستقرة. إذا كان النظام يستخدم التبديل بشكل مكثف أو تباطأت خدمات الملفات، فإن عبء العمل كبير جدًا بالنسبة للسعة المتاحة.

هل الذكاء الاصطناعي المعتمد على وحدة المعالجة المركزية فقط كافٍ للدردشة؟

يمكن أن يكون الذكاء الاصطناعي المعتمد على وحدة المعالجة المركزية فقط كافيًا للمطالبات القصيرة والنماذج الصغيرة، لكنه قد يبدو بطيئًا للدردشة التفاعلية اليومية. إذا استغرقت الردود وقتًا طويلاً، استخدم نموذجًا أصغر، أو تقليل دقة أكثر عدوانية، أو مسار iGPU إذا كان مدعومًا، أو إعداد جهازين حيث يشغّل جهاز آخر النموذج.

هل يجب أن أشغّل Ollama مباشرة على جهاز NAS أم على جهاز آخر؟

شغّل Ollama مباشرة على جهاز NAS إذا كنت تريد اختبارًا بسيطًا ومكتفيًا ذاتيًا والنموذج صغير. شغّل النموذج على جهاز محلي آخر إذا كنت تريد سرعة أفضل مع إبقاء جهاز NAS كواجهة ويب، أو طبقة تخزين، أو طبقة بيانات خاصة. هذا غالبًا ما يكون النمط الأفضل عندما يجب أن يظل جهاز NAS موثوقًا للملفات والنسخ الاحتياطية.

ما هو أفضل عبء عمل أولي للذكاء الاصطناعي المحلي لاختباره على جهاز NAS؟

ابدأ بنموذج صغير أو سير عمل بحث خفيف الوزن. تجنب البدء بتوليد الصور، أو نماذج الدردشة الحية الكبيرة، أو فهرسة المكتبة الكاملة خلال ساعات الذروة. يجب أن يثبت الاختبار الأول أن جهاز NAS يمكنه تشغيل عبء العمل دون الإضرار بالوصول إلى الملفات، أو النسخ الاحتياطية، أو خدمات الوسائط، أو الحاويات الأخرى.

يمكن أن يكون جهاز تخزين شبكي (NAS) بدون وحدة معالجة رسومات (GPU) نقطة انطلاق مفيدة للذكاء الاصطناعي المحلي، لكن يجب اعتباره مسألة ملاءمة عبء العمل بدلاً من ادعاء قدرة بنعم أو لا. طابق المهمة مع الأجهزة، اختبر سرعة الاستجابة في ظروف NAS الحقيقية، وحافظ على موثوقية التخزين قبل تجربة الذكاء الاصطناعي.

الدعم والنصائح

المزيد للقراءة

Get More Builds Like This

Stay in the Loop

Get updates from Zima - new products, exclusive deals, and real builds from the community.

Stay in the Loop preferences

We respect your inbox. Unsubscribe anytime.