1. Nền Tảng & Tổ Chức
- Anthropic: Công ty AI thành lập năm 2021 bởi cựu nhân sự OpenAI (Dario & Daniela Amodei), tập trung vào nghiên cứu AI an toàn
- Claude: Mô hình ngôn ngữ lớn (LLM) do Anthropic phát triển, được thiết kế để trung thực, hữu ích và không gây hại
- LLM (Large Language Model): Mô hình ngôn ngữ lớn — nền tảng kỹ thuật của Claude, được huấn luyện trên lượng văn bản khổng lồ để dự đoán ngôn ngữ tự nhiên
2. Kiến Trúc & Huấn Luyện
- Constitutional AI (Hiến pháp AI): Phương pháp huấn luyện độc quyền của Anthropic — thay vì chỉ dùng RLHF, Claude được huấn luyện tuân thủ một bộ quy tắc đạo đức định sẵn (gọi là “hiến pháp”)
- RLHF (Reinforcement Learning from Human Feedback): Học tăng cường từ phản hồi của con người — phương pháp huấn luyện phổ biến cho LLM, Claude kết hợp cả RLHF lẫn Constitutional AI
- Transformer Architecture: Kiến trúc nền tảng của Claude, cho phép xử lý và tạo văn bản tự nhiên
- Claude’s Constitution: Tài liệu định hình giá trị và hành vi của Claude, ưu tiên theo thứ tự: An toàn → Đạo đức → Tuân thủ hướng dẫn → Hữu ích
3. Các Phiên Bản Claude
4. Khái Niệm Ngữ Cảnh (Context)
- Context Window (Cửa sổ ngữ cảnh): Lượng thông tin tối đa Claude có thể “nhớ” trong một cuộc hội thoại — hiện lên đến 200K tokens (beta: 1M tokens)
- Token: Đơn vị xử lý văn bản (≈ 0.75 từ tiếng Anh); cả input lẫn output đều tính token
- Context Engineering: Nghệ thuật thiết kế và quản lý nội dung trong context window để tối ưu hiệu suất Claude
- Context Rot: Hiện tượng Claude giảm chất lượng khi context window quá đầy
- Extended Thinking: Chế độ Claude dành thêm token để “suy nghĩ sâu” trước khi trả lời — toàn bộ thinking tokens cũng tính vào context window
5. Cấu Trúc Giao Tiếp
- System Prompt: Hướng dẫn định nghĩa danh tính, vai trò và hành vi của Claude cho toàn bộ cuộc hội thoại — được nạp đầu tiên và tốn context ngay từ đầu
- User Prompt: Câu hỏi hoặc yêu cầu cụ thể mà người dùng gửi trong từng lượt hội thoại
- Principals (Các bên liên quan): Ba nhóm mà Claude phải cân bằng quyền lợi: Anthropic → Operators → End Users
- Operators: Nhà phát triển/doanh nghiệp dùng API Claude để xây dựng sản phẩm, có quyền tùy chỉnh hành vi Claude qua system prompt
6. Tính Năng & Công Cụ
- Artifacts: Vùng xuất nội dung độc lập (code, HTML, văn bản dài) ngay trong giao diện Claude.ai, tách biệt khỏi hội thoại
- MCP (Model Context Protocol): Giao thức kết nối Claude với các dịch vụ bên ngoài (Google Calendar, Gmail, Slack…) — mỗi MCP thêm vào sẽ tiêu thụ context window đáng kể
- Skills: Hướng dẫn chuyên biệt chỉ được nạp vào context khi Claude xác định có liên quan — giúp tiết kiệm token so với system prompt truyền thống
- Tool Use (Function Calling): Khả năng Claude gọi các công cụ/hàm bên ngoài để thực hiện tác vụ như tìm kiếm web, chạy code
7. Tác Nhân & Tự Động Hóa
- Claude Agents / Agentic AI: Claude hoạt động tự chủ trong nhiều bước, tự ra quyết định và thực hiện chuỗi tác vụ phức tạp mà không cần can thiệp liên tục
- Multi-agent: Nhiều Claude agent cộng tác với nhau, một agent làm orchestrator điều phối các agent con
- Prompt Chaining: Kỹ thuật chia tác vụ lớn thành nhiều API call liên tiếp để kiểm soát chất lượng từng bước
8. An Toàn & Đạo Đức
Hardcoded vs Softcoded behaviors: Hành vi cứng (không thể thay đổi dù operator yêu cầu) và hành vi mềm (có thể điều chỉnh theo ngữ cảnh triển khai)
Broadly Safe (An toàn rộng): Claude không làm suy yếu cơ chế giám sát AI của con người
Broadly Ethical (Đạo đức rộng): Claude trung thực, theo đuổi giá trị tốt, tránh hành động nguy hại