reinforcement-learning Jobs

93 jobs from companies building with AI

Researcher, Synthetic RL

OpenAI · San Francisco

reinforcement-learning search research

Technical Lead, Safety Research

OpenAI · San Francisco

deep-learning alignment llm reinforcement-learning fine-tuning search

Software Engineer, Applied Evals

OpenAI · San Francisco

reinforcement-learning llm deep-learning evaluation

Research Engineer/Research Scientist, RL/Reasoning

OpenAI · San Francisco

reinforcement-learning search research

Researcher, Health AI

OpenAI · San Francisco

reinforcement-learning deep-learning llm alignment search research

Researcher, Safety Oversight

OpenAI · San Francisco

alignment reinforcement-learning research search

Researcher, Trustworthy AI

OpenAI · San Francisco

llm reinforcement-learning alignment search rust research

Research Engineer / Research Scientist, Post-Training

OpenAI · San Francisco

reinforcement-learning search research

Researcher, Robustness & Safety Training

OpenAI · San Francisco

alignment deep-learning reinforcement-learning search research

Staff Research Engineer, Discovery Team

Anthropic · San Francisco, CA

reinforcement-learning distributed-systems alignment research search

Software Engineer, Sandboxing

Anthropic · San Francisco, CA | New York City, NY

reinforcement-learning alignment distributed-systems search research

Senior Research Scientist, Reward Models

Anthropic · Remote-Friendly (Travel Required) | San Francisco, CA

llm fine-tuning reinforcement-learning alignment research search

full-time senior

Research Lead, Training Insights

Anthropic · Remote-Friendly (Travel Required) | San Francisco, CA; San Francisco, CA | New York City, NY

pre-training alignment reinforcement-learning llm research search

Research Engineer, Virtual Collaborator (Cowork)

Anthropic · New York City, NY; San Francisco, CA; Seattle, WA

reinforcement-learning alignment search research

Research Engineer, Universes

Anthropic · Remote-Friendly (Travel-Required) | San Francisco, CA | Seattle, WA | New York City, NY

reinforcement-learning fine-tuning distributed-systems llm alignment search

Research Engineer / Scientist, Alignment Science - London

Anthropic · London, UK

fine-tuning alignment llm nlp reinforcement-learning research

Research Engineer / Scientist, Alignment Science

Anthropic · San Francisco, CA

alignment nlp reinforcement-learning fine-tuning llm research

Research Engineer, Science of Scaling

Anthropic · London, UK

alignment reinforcement-learning deep-learning llm research search

Research Engineer, Reward Models Platform

Anthropic · Remote-Friendly (Travel-Required) | San Francisco, CA | Seattle, WA | New York City, NY

alignment reinforcement-learning fine-tuning mlops distributed-systems research

Research Engineer / Research Scientist, Tokens

Anthropic · New York City, NY; New York City, NY | Seattle, WA; San Francisco, CA

pytorch reinforcement-learning alignment research search

← Previous Page 4 of 5 Next →

Agentic API

Build with our API. Let your agents post jobs and apply automatically.


                    # Search jobs

                    curl https://aidevboard.com/api/v1/jobs?tags=llm,pytorch


                    # Register for API access

                    curl -X POST https://aidevboard.com/api/v1/register/company \

                      -d '{"name":"Acme AI","email":"hire@acme.ai"}'