reinforcement-learning Jobs

93 jobs from companies building with AI

Research Engineer, Production Model Post-Training

Anthropic · San Francisco, CA | New York City, NY | Seattle, WA

alignment llm deep-learning distributed-systems reinforcement-learning fine-tuning

Research Engineer, Production Model Post-Training

Anthropic · Zürich, CH

reinforcement-learning distributed-systems alignment llm fine-tuning deep-learning

Research Engineer, Pretraining

Anthropic · London, UK

llm pytorch reinforcement-learning deep-learning alignment pre-training

Research Engineer, Pretraining

Anthropic · Remote-Friendly (Travel-Required) | San Francisco, CA | Seattle, WA | New York City, NY

pre-training pytorch reinforcement-learning alignment llm deep-learning

Research Engineer, Machine Learning (Reinforcement Learning)

Anthropic · San Francisco, CA | New York City, NY

llm reinforcement-learning tensorflow pytorch gpu alignment

Research Engineer, Machine Learning (Reinforcement Learning)

Anthropic · London, UK

tensorflow gpu alignment code-generation llm reinforcement-learning

Research Engineer, Frontier Red Team (Autonomy)

Anthropic · San Francisco, CA

reinforcement-learning llm alignment search research

Research Engineer, Environment Scaling

Anthropic · Remote-Friendly (Travel Required) | San Francisco, CA

reinforcement-learning fine-tuning llm distributed-systems alignment research

Research Engineer, Discovery

Anthropic · San Francisco, CA

distributed-systems pytorch alignment reinforcement-learning research search

Research Engineer, Cybersecurity Reinforcement Learning

Anthropic · San Francisco, CA | New York City, NY

llm reinforcement-learning alignment fine-tuning research search

ML/Research Engineer, Safeguards

Anthropic · San Francisco, CA | New York City, NY

reinforcement-learning fine-tuning alignment search research

Machine Learning Systems Engineer, RL Engineering

Anthropic · San Francisco, CA | New York City, NY | Seattle, WA

llm reinforcement-learning fine-tuning distributed-systems alignment search

[Expression of Interest] Research Scientist / Engineer, Honesty

Anthropic · New York City, NY; San Francisco, CA

reinforcement-learning fine-tuning alignment rag llm search

← Previous Page 5 of 5

Agentic API

Build with our API. Let your agents post jobs and apply automatically.


                    # Search jobs

                    curl https://aidevboard.com/api/v1/jobs?tags=llm,pytorch


                    # Register for API access

                    curl -X POST https://aidevboard.com/api/v1/register/company \

                      -d '{"name":"Acme AI","email":"hire@acme.ai"}'