Job Summary
15+ years of experience in DevOps Infrastructure Automation and Kubernetes administration.
Proven leadership in managing on-prem container orchestration platforms at scale.
Architectural understanding of microservices distributed systems and secure automation frameworks.
Deep expertise in Docker Kubernetes OpenShift and CI/CD tooling.
Experience with Helm GitOps and secure credential management.
Strong proficiency in Linux administration Shell scripting and Python.
Responsibilities
Kubernetes Cluster Leadership
Architect administer and scale enterprise-grade Kubernetes clusters in on-prem datacentre.
- Lead cluster lifecycle management: provisioning upgrades patching node pools and capacity planning.
Define and enforce multi-tenant governance using RBAC network policies Pod-Security Policies and Namespaces.
Implement and optimize Ingress controllers service meshes and API gateways for secure traffic routing.
Establish high availability disaster recovery and backup strategies for cluster components and workloads.
Drive root cause analysis and resolution of complex cluster-level issues.
Containerization & Orchestration Strategy
Oversee containerization standards using Docker Compose and private registries.
Lead deployment and orchestration of microservices via Kubernetes Helm.
Define resource optimization strategies including autoscaling affinity rules and quota enforcement.
CI/CD Architecture
Architect and govern CI/CD pipelines
Standardize build and release processes across diverse tech stacks
Design reusable pipeline frameworks and automation templates for rapid onboarding and delivery.
Integrate CI/CD with Kubernetes for seamless rollout rollback and canary deployments.
AI Workflow Enablement (ClearML)
Lead integration of ClearML for experiment tracking model versioning and pipeline orchestration.
Collaborate with AI/ML teams to containerize models and automate GPU job scheduling.
Build and maintain custom ClearML agents and workflows for reproducible experimentation and deployment.
Scripting & Tooling
Develop robust automation scripts in Shell Python
Build internal tools and dashboards to enhance infrastructure observability and operational efficiency.
Understanding of NIM services CUDA frameworks & libraries/models from OpenAI/Hugging face are good-to-have from Infrastructure perspective.
Certifications Required
relevant certifications
コグニザントについて
コグニザント(NASDAQ: CTSH)は、AI Builderおよびテクノロジーサービスプロバイダーとして、お客様にフルスタックのAIソリューションを構築することで、AI投資と企業価値を結ぶ架け橋となっています。業界、ビジネスプロセス、エンジニアリングに関する当社の深い専門知識を活かし、組織固有のビジネス環境をテクノロジー・システムに組み込みます。これにより、人間の可能性を最大限に引き出し、確かな成果を実現するとともに、急速に変化する世界においてグローバル企業が常に一歩先を行くための支援を行っています。 詳細については、cognizant.ai をご覧ください。
雇用に関する追加情報
本募集に記載されている報酬情報は、掲載日時点で正確なものです。Cognizantは、適用される法令に従い、いつでも本情報を変更する権利を留保します。
応募者は、対面またはビデオ会議による面接への参加を求められる場合があります。また、各面接の際に、現在有効な州政府または政府発行の身分証明書の提示を求められる場合があります。
Cognizantは機会均等雇用主です。応募および選考において、人種、肌の色、性別、宗教、信条、性的指向、性自認、国籍、障がい、遺伝情報、妊娠、退役軍人の地位、その他連邦法・州法・地方自治体の法律により保護されるいかなる特性に基づく差別も行いません。







