Welcome to EdgeAI Documentation | EdgeAI Documentation

EdgeAI runs actual Llama3.2-1B model inference on your Android device, powered by ExecuTorch and Qualcomm QNN acceleration.

Leverage Qualcomm's AI Engine Direct with v79 context binaries for optimal performance on Snapdragon processors.

Process AI requests locally without internet connectivity, ensuring privacy and reducing latency for better user experience.