AI训练模型

LLaMA

Inference code for Llama models. Contribute to meta-llama/llama development by creating an account on GitHub.

进入官网

LLaMA（Large Language Model Meta AI）是Meta于2023年2月发布的基础大语言模型系列，参数规模7B–65B。官网仓库托管在GitHub facebookresearch/llama，提供完整源码、权重申请脚本、推理示例、LoRA微调示例及社区贡献的llama-recipes。模型仅用公开数据训练，遵循非商业研究许可，可在单张A100 80G GPU或更小的消费级显卡上运行，实现接近GPT-3的效果，为研究者和开发者提供可复现、可扩展的开源基座。

主要功能

权重下载与校验：提供download.sh脚本，填写Meta邮件中的签名URL即可一键拉取7B/13B/30B/65B四档模型；含SHA256校验，防止篡改。
原生推理示例：example.py支持PyTorch原生加载，可指定--max-seq-len、--temperature等参数，快速体验文本续写、问答。
LoRA/QLoRA微调：llama-recipes子仓库内置HuggingFace PEFT、bitsandbytes 4-bit量化方案，单卡8G显存即可微调，附Samsum对话数据集示例。
多平台部署脚本：提供Dockerfile、Alpine Linux、Windows WSL2、macOS Metal一键脚本；Cloudflare Workers AI、AWS SageMaker JumpStart、GCP Vertex AI的现成模板。
社区生态集成：兼容HuggingFace Transformers、vLLM、Ollama、GPT4All、LangChain、LlamaIndex，可直接调用LlamaForCausalLM接口。
评估与基准：内置HellaSwag、MMLU、TruthfulQA等评测脚本，支持自定义数据集一键跑分。
安全与合规：附模型卡（Model Card）与使用政策，提供偏见检测、toxicity过滤示例，便于学术合规引用。

典型使用场景（≈300字）

学术研究：复现论文、分析大模型行为、探索对齐技术。
个人开发者：在笔记本或台式机（RTX 3090/4090）上搭建本地知识库、写作助手、代码补全。
企业内网：金融、医疗等对数据敏感行业，私有化部署离线问答系统。
教育场景：高校课程大模型实验，低成本GPU机房即可运行。
边缘设备：树莓派+4-bit量化做离线翻译、语音助手。

应用场景

优势特点

极致压缩：13B模型仅24 GB权重，4-bit量化后可<8 GB，单GPU即可推理。
完全开源：训练数据、代码、权重申请流程公开，可复现、可审计。
跨平台：Linux/Windows/macOS全支持，CPU/GPU/Metal多后端。
社区活跃：GitHub星标>50k，HuggingFace每日更新适配器、LoRA权重。
许可宽松：研究用途免费，商用可迁移到Llama-2商用许可，生态平滑升级。