Reasoning

Multi-Label Classification

10benchmarks

10papers

Video-based Generative Performance Benchmarking

Video-based Generative Performance Benchmarking (Consistency)

1benchmarks

9papers

Video-based Generative Performance Benchmarking (Contextual Understanding)

1benchmarks

9papers

Video-based Generative Performance Benchmarking (Correctness of Information)

1benchmarks

9papers

Video-based Generative Performance Benchmarking (Detail Orientation))

1benchmarks

9papers

Video-based Generative Performance Benchmarking (Temporal Understanding)

1benchmarks

9papers

Natural Language Inference

Answer Generation

2benchmarks

10papers

Visual Entailment

3benchmarks

9papers

Cross-Lingual Natural Language Inference

4benchmarks

10papers

Natural Language Inference

31benchmarks

10papers

Video Question Answering

20benchmarks

10papers

Zero-Shot Video Question Answer

13benchmarks

10papers

Few-shot Video Question Answering

0benchmarks

1papers

Autonomous Navigation

Sequential Place Recognition

0benchmarks

5papers

Autonomous Flight (Dense Forest)

1benchmarks

1papers

Decision Making Under Uncertainty

Uncertainty Visualization

0benchmarks

5papers

Decision Making Under Uncertainty

0benchmarks

7papers

Decision Making

Imitation Learning

0benchmarks

10papers

Decision Making

1benchmarks

10papers

Mathematical Proofs

Automated Theorem Proving

10benchmarks

9papers

Mathematical Proofs

0benchmarks

8papers

Multi-Label Learning

1benchmarks

7papers

Missing Labels

0benchmarks

9papers

Visual Reasoning

Visual Commonsense Reasoning

7benchmarks

10papers

Visual Reasoning

12benchmarks

10papers

General Reinforcement Learning

Offline RL

2benchmarks

10papers

Model-based Reinforcement Learning

0benchmarks

10papers

Commonsense Reasoning for RL

1benchmarks

1papers

Identify Odd Metapor

1benchmarks

2papers

Human Judgment Classification

1benchmarks

2papers

Human Judgment Correlation

2benchmarks

3papers

Anachronisms

0benchmarks

3papers

Theory of Mind Modeling

0benchmarks

5papers

Analogical Similarity

1benchmarks

4papers

Abstract Argumentation

0benchmarks

4papers

Pre-election ratings estimation

0benchmarks

1papers

Geometry Problem Solving

0benchmarks

8papers

Odd One Out

1benchmarks

9papers

Causal Identification

0benchmarks

10papers

Generative Visual Question Answering

Video-based Generative Performance Benchmarking

1benchmarks

9papers

Discrete Choice Models

0benchmarks

10papers

Natural Language Visual Grounding

0benchmarks

10papers

Multimodal Reasoning

3benchmarks

10papers

Systematic Generalization

0benchmarks

9papers

Mathematical Question Answering

Math Word Problem Solving

12benchmarks

10papers

Math Word Problem Solving

12benchmarks

10papers

Arithmetic Reasoning

1benchmarks

10papers

Multi-Label Classification

Multi-Label Classification

Missing Labels

Extreme Multi-Label Classification

Medical Code Prediction

Hierarchical Multi-label Classification

Video-based Generative Performance Benchmarking

Video-based Generative Performance Benchmarking (Consistency)

Video-based Generative Performance Benchmarking (Contextual Understanding)

Video-based Generative Performance Benchmarking (Correctness of Information)

Video-based Generative Performance Benchmarking (Detail Orientation))

Video-based Generative Performance Benchmarking (Temporal Understanding)

Natural Language Inference

Answer Generation

Visual Entailment

Cross-Lingual Natural Language Inference

Natural Language Inference

Video Question Answering

Video Question Answering

Zero-Shot Video Question Answer

Few-shot Video Question Answering

Autonomous Navigation

Sequential Place Recognition

Autonomous Flight (Dense Forest)

Decision Making Under Uncertainty

Uncertainty Visualization

Decision Making Under Uncertainty

Decision Making

Imitation Learning

Decision Making

Mathematical Proofs

Automated Theorem Proving

Mathematical Proofs

Multi-Label Learning

Multi-Label Learning

Missing Labels

Visual Reasoning

Visual Commonsense Reasoning

Visual Reasoning

General Reinforcement Learning

Offline RL

Model-based Reinforcement Learning

Commonsense Reasoning for RL

Commonsense Reasoning for RL

Identify Odd Metapor

Identify Odd Metapor

Human Judgment Classification

Human Judgment Classification

Human Judgment Correlation

Human Judgment Correlation

Anachronisms

Anachronisms

Theory of Mind Modeling

Theory of Mind Modeling

Analogical Similarity

Analogical Similarity

Abstract Argumentation

Abstract Argumentation

Pre-election ratings estimation

Pre-election ratings estimation

Geometry Problem Solving

Geometry Problem Solving

Odd One Out

Odd One Out

Causal Identification

Causal Identification

Generative Visual Question Answering

Video-based Generative Performance Benchmarking

Discrete Choice Models

Discrete Choice Models

Natural Language Visual Grounding

Natural Language Visual Grounding

Multimodal Reasoning

Multimodal Reasoning

Systematic Generalization

Systematic Generalization

Mathematical Question Answering

Math Word Problem Solving

Math Word Problem Solving