In Browser
	StumbleUpon
	del.icio.us
	Google
	Google Buzz
	reddit
	LinkedIn

	Facebook
	Twitter
	Linkedin
	E-Mail

Generative AI > OpenAI API > OpenAI Vision API - Analysing Images with GPT-4o

OpenAI Vision API - Analysing Images with GPT-4o

Author: Venkata Sudhakar

GPT-4o and GPT-4o-mini support vision input - you can pass images directly in the API request alongside text. This opens up powerful use cases for e-commerce: automated product listing from photos, damage assessment for return processing, label reading for inventory management, and visual quality control. The OpenAI Vision API accepts images as URLs or base64-encoded data.

Vision requests use the same Chat Completions API endpoint as text requests. You add image_url content blocks to the user message alongside text. The model processes both simultaneously, enabling questions like "What is the condition of this product?" with an attached photo - without any custom computer vision pipeline.

The below example uses the OpenAI Vision API to automate two ShopMax India workflows: extracting product details from a product image URL and assessing return eligibility from a damage photo.

from openai import OpenAI
import base64

client = OpenAI(api_key="YOUR_OPENAI_API_KEY")

def analyse_image(image_url, prompt):
    response = client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[
            {
                "role": "user",
                "content": [
                    {"type": "text", "text": prompt},
                    {"type": "image_url", "image_url": {"url": image_url, "detail": "low"}}
                ]
            }
        ],
        max_tokens=200
    )
    return response.choices[0].message.content

# Use case 1: Extract product details from a product listing image
product_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/2/20/Smiley_face.svg/480px-Smiley_face.svg.png"
details = analyse_image(
    product_url,
    "You are a ShopMax India product cataloguer. Describe what you see and list: product name, category, visible features, and suggested price range in Rs."
)
print("Product Details:")
print(details)

# Use case 2: Assess return condition from customer photo
damage_url = "https://upload.wikimedia.org/wikipedia/commons/thumb/2/20/Smiley_face.svg/480px-Smiley_face.svg.png"
assessment = analyse_image(
    damage_url,
    "You are a ShopMax India returns assessor. Evaluate the product condition: MINT (no damage), GOOD (minor wear), DAMAGED (visible damage), or BROKEN (non-functional). Give one sentence justification."
)
print("\nReturn Assessment:")
print(assessment)

It gives the following output,

Product Details:
Product: Decorative graphic icon
Category: Digital asset / sticker
Features: Circular design, yellow colour, simple expression
Suggested price range: Rs 0 - Rs 50 (digital download)

Return Assessment:
Condition: MINT
Justification: The item shows no visible damage, scratches,
or wear - it appears to be in perfect original condition
and qualifies for a full return under ShopMax policy.

Replace the Wikipedia image URLs with real product and damage photos from your ShopMax inventory system or customer uploads. For production use, pass base64-encoded images for private product photos that are not publicly accessible. Use detail="high" for images requiring fine-grained analysis like serial numbers or labels, and detail="low" for general product categorisation to reduce token costs.

Send your comments, suggestions or queries regarding this site to [email protected].