Search awesome repositories

promptfoo/promptfoo

Test your prompts, agents, and RAGs. Red teaming/pentesting/vulnerability scanning for AI. Compare performance of GPT, Claude, Gemini, DeepSeek, and more. Simple declarative configs with command line and CI/CD integration. Used by OpenAI and Anthropic.

TypeScript #ci #ci-cd #cicd #evaluation #evaluation-framework AI dev signals 6 awesome lists 8725 commits 4 history points updated 2026-05-25

★ 21,588

Website ↗ GitHub ↗

guidance-ai/guidance

A guidance language for controlling large language models.

Jupyter Notebook 2 awesome lists 1920 commits 2 history points updated 2026-05-21

★ 21,474

GitHub ↗

openai/evals

Evals is a framework for evaluating LLMs and LLM systems, and an open-source registry of benchmarks.

Python 4 awesome lists 691 commits 2 history points updated 2026-04-14

★ 18,531

GitHub ↗

pydantic/pydantic-ai

AI Agent Framework, the Pydantic way

Python PydanticAI pytest npmPEP 517uv #agent-framework #genai #llm #pydantic #python AI dev signals 6 awesome lists 2129 commits first commit 2024-06-14 9 history points updated 2026-06-03

★ 17,480

Website ↗ GitHub ↗

confident-ai/deepeval

The LLM Evaluation Framework

Python LangChain LlamaIndex Next.js pytest npmPoetryYarn #evaluation-framework #evaluation-metrics #llm-evaluation #llm-evaluation-framework #llm-evaluation-metrics 5 awesome lists 9548 commits first commit 2023-08-10 7 history points updated 2026-06-01

★ 15,871

Website ↗ GitHub ↗

jujumilk3/leaked-system-prompts

Collection of leaked system prompts

#ai #document #llm #prompt 1 awesome list 271 commits first commit 2023-05-16 2 history points updated 2026-03-30

★ 14,622

GitHub ↗

dottxt-ai/outlines

Structured Outputs

Python #cfg #generative-ai #json #llms #prompt-engineering AI dev signals 3 awesome lists 1254 commits 3 history points updated 2026-05-18

★ 13,892

Website ↗ GitHub ↗

567-labs/instructor

structured outputs for llms

Python FastAPI pytest pipuv #openai #openai-function-calli #openai-functions #pydantic-v2 #python AI dev signals 4 awesome lists 1557 commits first commit 2023-06-14 7 history points updated 2026-06-02

★ 13,086

Website ↗ GitHub ↗

EleutherAI/lm-evaluation-harness

A framework for few-shot evaluation of language models.

Python #evaluation-framework #language-model #transformer 4 awesome lists 4023 commits 3 history points updated 2026-05-11

★ 12,684

Website ↗ GitHub ↗

Piebald-AI/claude-code-system-prompts

All parts of Claude Code's system prompt, 27 builtin tool descriptions, sub agent prompts (Plan/Explore/Task), utility prompts (CLAUDE.md, compact, statusline, magic docs, WebFetch, Bash cmd, security review, agent creation). Updated for each Claude Code version.

JavaScript #claude-code #claude-code-system-prompts #system-prompts AI dev signals 1 awesome list 423 commits first commit 2025-11-19 2 history points updated 2026-06-02

★ 10,727

GitHub ↗

microsoft/agent-framework

A framework for building, orchestrating and deploying AI agents and multi-agent workflows with support for Python and .NET.

Python #agent-framework #agentic-ai #agents #ai #dotnet AI dev signals 3 awesome lists 2150 commits 3 history points updated 2026-05-25

★ 10,725

Website ↗ GitHub ↗

brexhq/prompt-engineering

Tips and tricks for working with Large Language Models like OpenAI's GPT-4.

2 awesome lists 16 commits first commit 2023-04-21 2 history points updated 2023-10-23

★ 9,539

GitHub ↗

davidkimai/Context-Engineering

"Context engineering is the delicate art and science of filling the context window with just the right information for the next step." — Andrej Karpathy. A frontier, first-principles handbook inspired by Karpathy and 3Blue1Brown for moving beyond prompt engineering to the wider discipline of context design, orchestration, and optimization.

Python AI dev signals 2 awesome lists 1140 commits first commit 2025-06-29 3 history points updated 2026-02-27

★ 9,044

Website ↗ GitHub ↗

MervinPraison/PraisonAI

PraisonAI 🦞 — Hire a 24/7 AI Workforce. Stop writing boilerplate and start shipping autonomous self-improving agents that research, plan, code, and execute tasks. Deployed in 5 lines of code with built-in memory, RAG, and support for 100+ LLMs.

Python #agents #ai #ai-agent-framework #ai-agent-sdk #ai-agents AI dev signals 6 awesome lists 3833 commits 4 history points updated 2026-05-25

★ 7,962

Website ↗ GitHub ↗

NVIDIA/garak

the LLM vulnerability scanner

Python #ai #llm-evaluation #llm-security #security-scanners #vulnerability-assessment AI dev signals 2 awesome lists 4049 commits 2 history points updated 2026-05-21

★ 7,910

Website ↗ GitHub ↗

NirDiamant/Prompt_Engineering

22 prompt engineering techniques with hands-on Jupyter Notebook tutorials, from fundamental concepts to advanced strategies for leveraging LLMs.

Jupyter Notebook LangChain Tornado pip #ai #chain-of-thought #chatgpt #claude #few-shot-learning 2 awesome lists 60 commits first commit 2024-10-10 2 history points updated 2026-05-31

★ 7,556

GitHub ↗

gepa-ai/gepa

Optimize prompts, code, and more with AI-powered Reflective Text Evolution

Jupyter Notebook AI dev signals 2 awesome lists 792 commits 2 history points updated 2026-05-22

★ 4,714

Website ↗ GitHub ↗

github/gh-aw

GitHub Agentic Workflows

Go #actions #cai #ci #claude-code #codex AI dev signals 2 awesome lists 12140 commits 2 history points updated 2026-05-27

★ 4,526

Website ↗ GitHub ↗

zou-group/textgrad

TextGrad: Automatic ''Differentiation'' via Text -- using large language models to backpropagate textual gradients. Published in Nature.

Python pip #ai-optimization #compound-systems #large-language-models #prompt-optimization #textual-gradients 1 awesome list 140 commits first commit 2024-06-11 2 history points updated 2025-07-25

★ 3,583

Website ↗ GitHub ↗

openai/openai-agents-js

A lightweight, powerful framework for multi-agent workflows and voice agents

TypeScript Astro Fastify Next.js React npmpnpm #agents #openai #openai-api #realtime-api #typescript AI dev signals 3 awesome lists 929 commits first commit 2025-06-03 2 history points updated 2026-06-01

★ 3,161

Website ↗ GitHub ↗

strukto-ai/mirage

A Unified Virtual Filesystem For AI Agents

TypeScript FastAPI Fastify pytest Vite npmpnpmuv #agent-sandbox #agent-tools #ai-agents #bash #claude-code AI dev signals 2 awesome lists 176 commits first commit 2026-05-06 3 history points updated 2026-06-03

★ 2,996

Website ↗ GitHub ↗

harbor-framework/terminal-bench

A benchmark for LLMs on complicated tasks in the terminal

Python FastAPI pytest React React Native CargoPEP 517pip AI dev signals 2 awesome lists 903 commits first commit 2025-01-17 3 history points updated 2026-01-22

★ 2,305

Website ↗ GitHub ↗

microsoft/agent-governance-toolkit

AI Agent Governance Toolkit — Policy enforcement, zero-trust identity, execution sandboxing, and reliability engineering for autonomous AI agents. Covers 10/10 OWASP Agentic Top 10.

Python #agent-framework #ai-agents #ai-safety #compliance #governance AI dev signals 3 awesome lists 1726 commits 3 history points updated 2026-05-25

★ 2,227

GitHub ↗

Shichun-Liu/Agent-Memory-Paper-List

The paper list of "Memory in the Age of AI Agents: A Survey"

#agent #memory 1 awesome list 40 commits first commit 2025-12-13 2 history points updated 2026-03-04

★ 2,085

Website ↗ GitHub ↗

jherrodthomas/automotive-skills-suite

100+ installable Claude skills covering Engineering areas such as, ISO 26262 functional safety, ISO/SAE 21434 cybersecurity, ISO 21448 SOTIF, AIAG-VDA quality (APQP/PPAP/FMEA), Automotive SPICE, and continuous improvement tools — every builder paired with a confirmation reviewer.

#apqp #aspice #automotive #autosar #engineering 1 awesome list 27 commits first commit 2026-05-01 2 history points updated 2026-06-02

★ 1,749

GitHub ↗

SethGammon/Citadel

Agent orchestration harness for Claude Code. Four-tier routing (/do), campaign persistence across sessions, parallel agents in isolated worktrees, discovery relay between waves, lifecycle hooks, circuit breaker, and 6 production-quality skills. From solo developer to institutional scale.

JavaScript npm AI dev signals 1 awesome list 275 commits first commit 2026-03-20 2 history points updated 2026-06-01

★ 583

GitHub ↗

EliFuzz/awesome-system-prompts

A collection of system prompts and tool definitions from various AI coding agents: Augment Code, Claude Code, Cluely, Cursor, Devin AI, Kiro, Perplexity, VSCode Agent, Gemini, Codex, OpenAI

JavaScript React npmpnpm #ai #anthropic #awesome #claude-code #codex 1 awesome list 93 commits first commit 2025-10-03 2 history points updated 2026-03-06

★ 208

Website ↗ GitHub ↗

ML-GSAI/Diffusion-LLM-Papers

A Collection of Papers on Diffusion Language Models

1 awesome list 50 commits first commit 2025-05-28 2 history points updated 2025-09-15

★ 171

GitHub ↗

langgptai/awesome-deep-research-prompts

Prompts for deep research （openai， gemini，qwen）

1 awesome list 4 commits first commit 2025-04-30 2 history points updated 2025-05-17

★ 120

GitHub ↗

jhammant/agent-drift

Stress-test AI agents for goal drift and system prompt violations. Inspired by 'Asymmetric Goal Drift in Coding Agents' (ICLR 2026).

HTML pytest PEP 517 #agents #ai-safety #alignment #goal-drift #llm 1 awesome list 15 commits first commit 2026-03-05 2 history points updated 2026-03-16

★ 8

GitHub ↗

Search awesome repositories

Find repositories

Put your repository first

How it works

Pricing

How it works

Pricing