مدلهای زبانی بزرگ (Large Language Models یا به اختصار LLMs) طی سالهای اخیر انقلابی در حوزه هوش مصنوعی ایجاد کردهاند. این مدلها با قدرت تولید متن، پاسخ به پرسشها، ترجمه، خلاصهسازی و حتی کدنویسی، کاربردهای متنوعی در صنایع مختلف یافتهاند. اگر علاقهمند به یادگیری عمیقتر این مدلها هستید یا میخواهید پروژههای مبتنی بر LLM توسعه دهید، آشنایی با منابع معتبر و کاربردی ضروری است.
در این مقاله، ۱۰ مخزن مهم GitHub را بررسی میکنیم که میتوانند مسیر یادگیری و کار با LLMها را برای شما هموارتر کنند.
۱. brexhq/prompt-engineering
موضوع: مهندسی پرامپت (Prompt Engineering)
این مخزن مجموعهای از تکنیکها، مثالها و نکات برای طراحی پرامپتهای مؤثر برای LLMها است. مهندسی پرامپت یک مهارت اساسی برای تعامل با مدلهایی مانند ChatGPT است و یادگیری آن میتواند عملکرد مدل را بهبود ببخشد. این مخزن شامل دستهبندیهای مختلفی مانند تولید محتوا، خلاصهسازی، ترجمه، پرسش و پاسخ، و موارد دیگر است.
۲. mlabonne/llm-course
موضوع: دوره آموزشی جامع LLM
اگر به دنبال یادگیری ساختارمند و گامبهگام هستید، این دوره GitHub محور یک انتخاب عالی است. دوره به مباحثی مانند معماری مدلهای زبانی، آموزش، تنظیم دقیق (fine-tuning)، و استفاده از APIها میپردازد. بهخصوص برای کسانی که از برنامهنویسی پایتون و فریمورکهایی مانند PyTorch یا Hugging Face استفاده میکنند بسیار مفید است.
۳. Hannibal046/Awesome-LLM
موضوع: فهرستی از منابع LLM
یک مخزن جامع از مقالات، ابزارها، چارچوبها، کتابها و دورههای آنلاین درباره LLMها. این منبع برای افرادی که میخواهند همیشه بهروز باشند و منابع متنوعی در اختیار داشته باشند بسیار کاربردی است.
۴. WooooDyy/LLM-Agent-Paper-List
موضوع: پژوهشهای مربوط به عاملهای LLM
در این مخزن، فهرستی از مقالات تحقیقاتی درباره عاملهای خودمختار (Autonomous Agents) که از LLMها بهره میبرند جمعآوری شده است. اگر به مباحثی مانند AutoGPT یا AgentGPT علاقه دارید، این مخزن برای بررسی مفاهیم پیشرفته مفید خواهد بود.
۵. avvorstenbosch/Masterclass-LLMs-for-Data-Science
موضوع: استفاده از LLM در علم داده
این منبع برای کاربران داده طراحی شده تا بتوانند با استفاده از LLMs بهرهوری خود را افزایش دهند. آموزشها به صورت عملی همراه با تمرین و مثال ارائه شدهاند و چگونگی ادغام مدلهای زبانی در پروژههای دادهمحور را نشان میدهند.
۶. Shubhamsaboo/awesome-llm-apps
موضوع: برنامههای ساخته شده با LLM
لیستی الهامبخش از اپلیکیشنهای کاربردی LLM، از جمله چتباتها، ابزارهای خلاقانه، مدلهای پاسخ به سوال و موارد دیگر. اگر قصد توسعه یک اپلیکیشن با مدلهایی مانند GPT-4، Claude یا LLaMA را دارید، این مخزن شما را با پروژههای موفق آشنا میکند.
۷. BradyFU/Awesome-Multimodal-Large-Language-Models
موضوع: مدلهای زبانی چندوجهی
مدلهای چندوجهی (Multimodal LLMs) قابلیت درک همزمان متن، تصویر، صوت و ویدئو را دارند. این مخزن به بررسی این نوع مدلها و پروژههای مربوط به آنها میپردازد. برای مثال، میتوان به پروژههایی مانند GPT-4V و Flamingo اشاره کرد.
۸. HandsOnLLM/Hands-On-Large-Language-Models
موضوع: مخزن کتاب عملی LLM از O’Reilly
این مخزن مکملی برای کتاب «Hands-On Large Language Models» از انتشارات O’Reilly است و شامل کدهای آموزشی، تمرینهای عملی و پروژههای کاربردی برای کار با LLMها میشود. این منبع برای یادگیری تجربی فوقالعاده است.
۹. mshumer/gpt-curriculum
موضوع: برنامه درسی برای GPT
مجموعهای ساختاریافته برای یادگیری معماری و عملکرد GPT. از مفاهیم اولیه تا پیادهسازیهای عملی را پوشش میدهد. برای کسانی که دنبال درک تئوری همراه با تمرین هستند، بسیار مفید است.
۱۰. lucidrains/PaLM-rlhf-pytorch
موضوع: مدل PaLM با RLHF در PyTorch
پیادهسازی پایتورچی از مدل PaLM همراه با تکنیک یادگیری تقویتی با بازخورد انسانی (RLHF). این مخزن به علاقهمندان مباحث پیشرفته و توسعه مدلهای سفارشی توصیه میشود.
درک مدلهای زبانی بزرگ و استفاده مؤثر از آنها، مستلزم یادگیری مستمر و دسترسی به منابع کاربردی است. ده مخزن معرفیشده در این مقاله، نهتنها دانش نظری شما را تقویت میکنند بلکه ابزارهایی برای پیادهسازی پروژههای واقعی در اختیار شما قرار میدهند.
از مهندسی پرامپت گرفته تا توسعه اپلیکیشن، از تحلیل داده با LLM تا ساخت عاملهای هوشمند، این منابع راهنمایی عملی برای پیشرفت در دنیای هوش مصنوعی هستند.
اگر تازهکار هستید، پیشنهاد میکنیم با مخزن mlabonne/llm-course شروع کنید. سپس با استفاده از سایر منابع، مهارتهای خود را در زمینه تولید محتوا، برنامهنویسی، تحلیل داده و یادگیری عمیق تقویت کنید.

