Job Summary
We are seeking technical and experienced AI Agentic Solutions Architects to join our advanced technology group. This role is dedicated to the hands-on design, development, and deployment of sophisticated Agentic AI solutions. You will be responsible for executing complex Proof of Concepts (PoCs) that demonstrate cutting-edge AI capabilities for our key customers. The role requires building and optimizing AI agents on high-performance Nvidia-based GPU infrastructure (including A100 and H100 systems) and leveraging Cognizant's proprietary ATK platform. The ideal candidate is a hands-on architect with a strong background in MLOps and extensive experience with modern agentic frameworks, advanced data semantics, and the Nvidia AI ecosystem.
Key Responsibilities
Architect, build, and optimize multi-agent AI solutions using frameworks like LangChain, LlamaIndex, and AutoGen.
Design and implement complex data ingestion and processing pipelines, ensuring robust data semantics for Retrieval-Augmented Generation (RAG) architectures.
Develop and fine-tune Large Language Models (LLMs) and other foundational models using the Nvidia NeMo framework.
Deploy and manage high-throughput, low-latency model inference services using Nvidia Triton Inference Server.
Conduct performance profiling and optimization of AI workloads on Nvidia A100 and H100 Tensor Core GPUs.
Integrate and manage specialized vector databases such as Milvus, Pinecone, and Weaviate for high-dimensional data indexing and search.
Leverage Cognizant's ATK platform to orchestrate complex agentic workflows and ensure seamless integration with enterprise systems.
Collaborate with infrastructure teams to ensure optimal configuration of Kubernetes clusters for GPU-accelerated workloads.
Required Skills and Experience
Agentic Frameworks: Minimum 2+ years of hands-on experience with LangChain and/or LlamaIndex. Demonstrable ability to build complex chains, tools, and autonomous agents.
Vector Databases: Proven expertise in deploying and managing at least one of the following: Milvus, Pinecone, Weaviate, or ChromaDB. Deep understanding of embedding models, indexing strategies (e.g., HNSW, IVF), and semantic search.
Nvidia Software Stack:
Nvidia Triton Inference Server: Hands-on experience deploying and scaling models for production.
Nvidia NeMo: Experience in training or fine-tuning models.
CUDA/cuDNN: Strong understanding of the CUDA programming model and library ecosystem for GPU acceleration.
Nvidia Hardware Stack: Demonstrable experience working with and optimizing for Nvidia A100 or H100 GPUs. Familiarity with concepts like Multi-Instance GPU (MIG) is highly desirable.
ML Frameworks & MLOps: Expert-level proficiency in Python and PyTorch. Strong experience with MLOps principles and tools, including containerization with Docker and orchestration with Kubernetes.
Problem-Solving: Advanced analytical and debugging skills for complex, distributed AI systems.
Preferred Qualifications
Experience with advanced RAG techniques, including re-ranking and query transformation.
Familiarity with Nvidia's full enterprise software suite.
Experience in a customer-facing role, delivering technically complex PoCs or solutions.
Active contributions to open-source projects in the AI/ML ecosystem.
La communauté Cognizant :
Nous sommes une équipe de professionnels dont les membres s'apprécient et se soutiennent mutuellement. Nos collaborateurs sont les garants d'un lieu de travail dynamique, collaboratif et inclusif où chacun peut s'épanouir.
- Cognizant est une communauté mondiale qui compte plus de 300 000+ collaborateurs dans le monde entier.
- Nous ne nous contentons pas de rêver de façons idéales, nous apportons des améliorations concrêtes
- Nous prenons soin de nos collaborateurs, de nos clients, de notre entreprise, de nos communautés et du climat, en faisant ce qui est juste.
- Nous favorisons un environnement innovant où vous pouvez construire le plan de carrière qui vous convient.
À propos de nous :
Cognizant (NASDAQ : CTSH) est un concepteur d’IA et un fournisseur de services technologiques. Avec notre gamme de solutions IA full-stack, nous accompagnons nos clients au carrefour de l’investissement dans l’IA et de la valeur ajoutée. Notre grande expertise sectorielle, des processus et de l’ingénierie nous permet de convertir le contexte propre à chaque entreprise en systèmes technologiques amplificateurs du potentiel humain, générateurs de résultats tangibles et garants de l’avantage des acteurs internationaux dans un monde en constante évolution. Découvrez notre méthode sur www.cognizant.com ou suivez @cognizant.
Cognizant est un employeur soucieux de l'égalité des chances entre candidats. Votre candidature sera étudiée indépendamment de votre race, couleur, sexe, religion, croyances, orientation sexuelle, identité de genre, origine, handicap, informations génétiques, grossesse, statut d'ancien militaire ou de toute autre critère jugé discriminant par les lois européennes ou françaises.
Vous êtes porteur d'un handicap, vous pouvez-nous contacter par courriel [email protected] si vous souhaitez préciser les aménagements nécessaires pour le poste ou les entretiens à venir.
Mentions légales :
Les informations relatives à la rémunération du poste à pourvoir dépendent de la date de publication de l’offre de poste. Cognizant se réserve le droit de modifier ces informations à tout moment, sous réserve des lois applicables.
Les candidats peuvent être invités à participer à des entretiens en face à face ou par vidéoconférence. En outre, les candidats peuvent être amenés à présenter une carte d'identité valide lors de chaque entretien.