Fine-tuning

Model type

Model Size

Price per 1M Tokens (per epoch)

Llama 3.2

1B & 3B

$1

Llama 3.1

8B

$2

Llama 3.1

70B

$10

Inference

Model type

Model Size

Price (per 1M Tokens)

Llama 3.2

1B & 3B

3 cents

Llama 3.1 & Llama 3.2

8B & 11B

9 cents

Llama 3.1 & Llama 3.3

70B & 70B

60 cents

Llama 3.2

405B

90 cents

Llama 3.1

405B

$2

Model type

Model Size

Price (per minute)

Llama 3.2

1B & 3B

1 cent

Llama 3.1 & Llama 3.2

8B & 11B

3 cents

Inference

Serverless

Model type

Model Size

Price (per 1M Tokens)

Llama 3.2

1B & 3B

3 cents

Llama 3.1 & Llama 3.2

8B & 11B

9 cents

Llama 3.1 & Llama 3.3

70B & 70B

60 cents

Llama 3.2

405B

90 cents

Llama 3.1

405B

$2

Dedicated

Model type

Model Size

Price (per minute)

Llama 3.2

1B & 3B

1 cent

Llama 3.1 & Llama 3.2

8B & 11B

3 cents