Research Papers

The research that matters, distilled — search, filter by topic, sort, and group.

107 results

		Topics
Tree of Thoughts: Deliberate Problem Solving with Large Language Models	Princeton	Agents	May 17, 2023
Segment Anything	Meta	Architecture	Apr 5, 2023
GPT-4 Technical Report	OpenAI	ArchitectureEvaluationSafety	Mar 15, 2023
LLaMA: Open and Efficient Foundation Language Models	Meta	Training	Feb 27, 2023
Toolformer: Language Models Can Teach Themselves to Use Tools	Meta	Agents	Feb 9, 2023
Constitutional AI: Harmlessness from AI Feedback	Anthropic	SafetyReinforcement Learning	Dec 15, 2022
Robust Speech Recognition via Large-Scale Weak Supervision	OpenAI	Architecture	Dec 6, 2022
BLOOM: A 176B-Parameter Open-Access Multilingual Language Model	BigScience	Training	Nov 9, 2022
Scaling Instruction-Finetuned Language Models	Google	Training	Oct 20, 2022
ReAct: Synergizing Reasoning and Acting in Language Models	Princeton	Agents	Oct 6, 2022
Emergent Abilities of Large Language Models	Google	Evaluation	Jun 15, 2022
FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness	Stanford	Architecture	May 27, 2022
OPT: Open Pre-trained Transformer Language Models	Meta	Training	May 2, 2022
Flamingo: a Visual Language Model for Few-Shot Learning	DeepMind	Architecture	Apr 29, 2022
PaLM: Scaling Language Modeling with Pathways	Google	Training	Apr 5, 2022
Training Compute-Optimal Large Language Models	DeepMind	Training	Mar 29, 2022
Training language models to follow instructions with human feedback	OpenAI	TrainingReinforcement LearningSafety	Mar 4, 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models	Google	EvaluationAgents	Jan 28, 2022
High-Resolution Image Synthesis with Latent Diffusion Models	LMU Munich	Architecture	Dec 20, 2021
Highly Accurate Protein Structure Prediction with AlphaFold	DeepMind	Architecture	Jul 15, 2021
Evaluating Large Language Models Trained on Code	OpenAI	Evaluation	Jul 7, 2021
LoRA: Low-Rank Adaptation of Large Language Models	Microsoft	Training	Jun 17, 2021
RoFormer: Enhanced Transformer with Rotary Position Embedding	Zhuiyi Technology	Architecture	Apr 20, 2021
Learning Transferable Visual Models From Natural Language Supervision	OpenAI	ArchitectureTraining	Feb 26, 2021