Stability AI Image Generation - Roboflow Inference

Name	Type	Description	Refs
`name`	`str`	Enter a unique identifier for this step..	❌
`strength`	`float`	controls how much influence the image parameter has on the generated image. A value of 0 would yield an image that is identical to the input. A value of 1 would be as if you passed in no image at all..	✅
`prompt`	`str`	Prompt to generate new images from text (what you wish to see).	✅
`negative_prompt`	`str`	Negative prompt to image generation model (what you do not wish to see).	✅
`model`	`str`	choose one of {'core', 'ultra', 'sd3'}. Default 'core' .	✅
`api_key`	`str`	Your Stability AI API key.	✅

Compatible Blocks

Check what blocks you can connect to Stability AI Image Generation in version v1.

inputs: Image Preprocessing, Anthropic Claude, Image Slicer, Dynamic Crop, Bounding Box Visualization, Absolute Static Crop, SIFT Comparison, Stitch Images, Stitch OCR Detections, OpenAI, Email Notification, Stability AI Inpainting, EasyOCR, Llama 3.2 Vision, Florence-2 Model, Roboflow Custom Metadata, Auto Rotate on Edges, Keypoint Detection Model, Stability AI Outpainting, Model Comparison Visualization, Slack Notification, Line Counter Visualization, Camera Calibration, Single-Label Classification Model, Clip Comparison, VLM As Detector, CogVLM, Camera Focus, Corner Visualization, Ellipse Visualization, PP-OCR, Morphological Transformation, Anthropic Claude, Roboflow Visual Search, Color Visualization, Instance Segmentation Model, OpenAI, Triangle Visualization, Image Contours, Image Threshold, Current Time, Roboflow Visual Search Classifier, QR Code Generator, OpenAI-Compatible LLM, Florence-2 Model, Polygon Zone Visualization, Stitch OCR Detections, Roboflow Asset Library Attributes, Microsoft SQL Server Sink, VLM As Classifier, Camera Focus, Image Convert Grayscale, Label Visualization, Llama 3.2 Vision, Stability AI Image Generation, MQTT Writer, Roboflow Dataset Upload, Local File Sink, Identify Outliers, Google Gemini, Event Writer, Depth Estimation, Google Gemini, OpenAI, Trace Visualization, Twilio SMS Notification, LMM For Classification, Object Detection Model, Webhook Sink, Halo Visualization, Mask Visualization, Pixelate Visualization, Twilio SMS/MMS Notification, MoonshotAI Kimi, Dot Visualization, Multi-Label Classification Model, OPC UA Writer Sink, Google Gemini, Keypoint Visualization, LMM, Image Slicer, OCR Model, Circle Visualization, Contrast Enhancement, Relative Static Crop, Morphological Transformation, Email Notification, Halo Visualization, Cosmos 3, Polygon Visualization, Qwen-VL, PLC Writer, Google Gemma, Crop Visualization, Qwen 3.5 API, Model Monitoring Inference Aggregator, Icon Visualization, Heatmap Visualization, Google Gemma API, Detections Consensus, CSV Formatter, Image Blur, Background Color Visualization, Grid Visualization, Blur Visualization, GLM-OCR, Anthropic Claude, Reference Path Visualization, Classification Label Visualization, Google Vision OCR, Perspective Correction, Background Subtraction, Polygon Visualization, Contrast Equalization, SIFT, Qwen 3.6 API, Text Display, MoonshotAI Kimi, OpenRouter, Qwen3.5-VL, Roboflow Vision Events, Identify Changes, OpenAI, S3 Sink, Roboflow Dataset Upload
outputs: SAM 3, Image Preprocessing, Single-Label Classification Model, Anthropic Claude, Image Slicer, CLIP Embedding Model, Dynamic Crop, BoT-SORT Tracker, Bounding Box Visualization, Mask Edge Snap, Object Detection Model, QR Code Detection, Absolute Static Crop, SIFT Comparison, Stitch Images, OpenAI, Instance Segmentation Model, Email Notification, Stability AI Inpainting, Frame Delay, EasyOCR, Llama 3.2 Vision, Track Class Lock, Florence-2 Model, Gaze Detection, Auto Rotate on Edges, YOLO-World Model, Dominant Color, Keypoint Detection Model, Stability AI Outpainting, Model Comparison Visualization, Line Counter Visualization, Camera Calibration, Single-Label Classification Model, Clip Comparison, VLM As Detector, CogVLM, SORT Tracker, Corner Visualization, PP-OCR, Camera Focus, Ellipse Visualization, Morphological Transformation, Anthropic Claude, Roboflow Visual Search, Instance Segmentation Model, Color Visualization, OpenAI, Time in Zone, Triangle Visualization, Detections Stabilizer, Object Detection Model, Image Contours, SAM 3, Image Threshold, SAM 3, Barcode Detection, Roboflow Visual Search Classifier, Qwen2.5-VL, Florence-2 Model, Semantic Segmentation Model, SmolVLM2, Polygon Zone Visualization, GeoTag Detection, Moondream2, VLM As Classifier, Camera Focus, Image Convert Grayscale, Label Visualization, Llama 3.2 Vision, Stability AI Image Generation, VLM As Detector, Perception Encoder Embedding Model, Instance Segmentation Model, Roboflow Dataset Upload, VLM As Classifier, Google Gemini, Event Writer, Semantic Segmentation Model, Depth Estimation, Seg Preview, Byte Tracker, Google Gemini, OpenAI, Trace Visualization, Pixel Color Count, SAM 3 Interactive, LMM For Classification, Object Detection Model, Halo Visualization, Buffer, Mask Visualization, Template Matching, Twilio SMS/MMS Notification, Pixelate Visualization, MoonshotAI Kimi, Dot Visualization, Multi-Label Classification Model, Image Stack, Google Gemini, OC-SORT Tracker, Keypoint Visualization, LMM, Image Slicer, OCR Model, Circle Visualization, Contrast Enhancement, Relative Static Crop, SAM2 Video Tracker, ByteTrack Tracker, Morphological Transformation, Halo Visualization, Clip Comparison, Cosmos 3, Polygon Visualization, Qwen-VL, Google Gemma, Crop Visualization, Qwen 3.5 API, Qwen3-VL, Qwen3.5, Keypoint Detection Model, Single-Label Classification Model, Icon Visualization, Heatmap Visualization, Motion Detection, Multi-Label Classification Model, Google Gemma API, Instance Segmentation Model, SAM3 Video Tracker, Image Blur, Background Color Visualization, Detections Stitch, Segment Anything 2 Model, Blur Visualization, GLM-OCR, Anthropic Claude, Reference Path Visualization, Classification Label Visualization, Google Vision OCR, Background Subtraction, Perspective Correction, Polygon Visualization, Contrast Equalization, SIFT, Qwen 3.6 API, Text Display, MoonshotAI Kimi, OpenRouter, Qwen3.5-VL, Roboflow Vision Events, OpenAI, Keypoint Detection Model, Multi-Label Classification Model, Roboflow Dataset Upload

Bindings

input
- image (image): The image to use as the starting point for the generation..
- strength (float_zero_to_one): controls how much influence the image parameter has on the generated image. A value of 0 would yield an image that is identical to the input. A value of 1 would be as if you passed in no image at all..
- prompt (string): Prompt to generate new images from text (what you wish to see).
- negative_prompt (string): Negative prompt to image generation model (what you do not wish to see).
- model (string): choose one of {'core', 'ultra', 'sd3'}. Default 'core' .
- api_key (Union[secret, string]): Your Stability AI API key.
output
- image (image): Image in workflows.

Example JSON definition of step Stability AI Image Generation in version v1

{
    "name": "<your_step_name_here>",
    "type": "roboflow_core/stability_ai_image_gen@v1",
    "image": "$inputs.image",
    "strength": 0.3,
    "prompt": "my prompt",
    "negative_prompt": "my prompt",
    "model": "my prompt",
    "api_key": "xxx-xxx"
}

Stability AI Image Generation¶

Type identifier¶

Properties¶

Runtime compatibility¶

Available Connections¶

Input and Output Bindings¶