Job Summary
15+ years of experience in DevOps Infrastructure Automation and Kubernetes administration.
Proven leadership in managing on-prem container orchestration platforms at scale.
Architectural understanding of microservices distributed systems and secure automation frameworks.
Deep expertise in Docker Kubernetes OpenShift and CI/CD tooling.
Experience with Helm GitOps and secure credential management.
Strong proficiency in Linux administration Shell scripting and Python.
Responsibilities
Kubernetes Cluster Leadership
Architect administer and scale enterprise-grade Kubernetes clusters in on-prem datacentre.
- Lead cluster lifecycle management: provisioning upgrades patching node pools and capacity planning.
Define and enforce multi-tenant governance using RBAC network policies Pod-Security Policies and Namespaces.
Implement and optimize Ingress controllers service meshes and API gateways for secure traffic routing.
Establish high availability disaster recovery and backup strategies for cluster components and workloads.
Drive root cause analysis and resolution of complex cluster-level issues.
Containerization & Orchestration Strategy
Oversee containerization standards using Docker Compose and private registries.
Lead deployment and orchestration of microservices via Kubernetes Helm.
Define resource optimization strategies including autoscaling affinity rules and quota enforcement.
CI/CD Architecture
Architect and govern CI/CD pipelines
Standardize build and release processes across diverse tech stacks
Design reusable pipeline frameworks and automation templates for rapid onboarding and delivery.
Integrate CI/CD with Kubernetes for seamless rollout rollback and canary deployments.
AI Workflow Enablement (ClearML)
Lead integration of ClearML for experiment tracking model versioning and pipeline orchestration.
Collaborate with AI/ML teams to containerize models and automate GPU job scheduling.
Build and maintain custom ClearML agents and workflows for reproducible experimentation and deployment.
Scripting & Tooling
Develop robust automation scripts in Shell Python
Build internal tools and dashboards to enhance infrastructure observability and operational efficiency.
Understanding of NIM services CUDA frameworks & libraries/models from OpenAI/Hugging face are good-to-have from Infrastructure perspective.
Certifications Required
relevant certifications
Über Cognizant
Cognizant (NASDAQ: CTSH) i ist ein Technologiedienstleister und Entwickler von KI-Lösungen. Wir schlagen die Brücke zwischen KI-Investitionen und echtem unternehmerischem Mehrwert, indem wir ganzheitliche Full-Stack-KI-Lösungen für unsere Kunden entwickeln. Mit unserer fundierten Branchen-, Prozess- und Engineering-Expertise integrieren wir die spezifischen Anforderungen von Unternehmen passgenau in Technologiesysteme. So entfalten wir das menschliche Potenzial, erzielen greifbare Ergebnisse und sichern globalen Unternehmen in einer sich rasant wandelnden Welt den entscheidenden Vorsprung. Erfahren Sie mehr unter cognizant.ai oder @cognizant.
Zusätzliche Informationen zur Beschäftigung
Die Vergütungsinformationen sind zum Zeitpunkt der Veröffentlichung dieser Stellenausschreibung korrekt. Cognizant behält sich das Recht vor, diese Informationen jederzeit unter Beachtung der geltenden gesetzlichen Bestimmungen zu ändern.
Bewerberinnen und Bewerber können verpflichtet sein, an Vorstellungsgesprächen persönlich oder per Videokonferenz teilzunehmen. Darüber hinaus kann es erforderlich sein, bei jedem Gespräch einen gültigen staatlichen Lichtbildausweis vorzulegen.
Cognizant ist ein Arbeitgeber mit Chancengleichheit. Ihre Bewerbung und Kandidatur werden nicht aufgrund von Rasse, Hautfarbe, Geschlecht, Religion, Glaubensbekenntnis, sexueller Orientierung, Geschlechtsidentität, nationaler Herkunft, Behinderung, genetischen Informationen, Schwangerschaft, Veteranenstatus oder sonstiger durch bundes‑, landes‑ oder kommunalrechtliche Vorschriften geschützter Merkmale berücksichtigt oder abgelehnt.







