Skip to content
Avatar
🦁
in the jungle
🦁
in the jungle

Achievements

Achievements

Organizations

@apache
Block or Report

Block or report 1ambda

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
1ambda/README.md

안녕하세요. 데이터 및 클라우드 인프라 엔지니어로 일 하? 있습니다. 더 자세한 이?은 Linkedin 에서 확인하실 수 있습니다.

대기업, 20명 이하의 스타트업, ?니콘과 같이 다양한 규모의 회사에서 아래와 같은 노동과 경험을 쌓아 왔습니다.
몇년 ? 부터는 먹?사느라 (..) 바?서 블로그에 글 쓸 시간이 없지만 작은 블로그 를 하나 운영하? 있습니다.
간간히 올리곤 하는 엔지니어링에 관한 짧은 생각들은 ? Facebook 에서 보실 수 있습니다.


가장 최근에는 Practical Data Pipeline 이라는 Gitbook 을 작성하? 있습니다. 아래의 주?들을 엮어 데이터 인프라 세상을 처음 마주하시는 분들이 Storage, Computing Engine, Application Infra 등을 쉽게 ?하실 수 있도록 조금이나마 도움을 드리? 싶습니다.


Speakings

아래 내용은, 최근까지 해온 커뮤니티 활동중 공개된 행사에서 진행된 슬라이드와 영상을 일부를 모아, 참?하실 수 있도록 링크를 만? 것입니다. 과거에 작성된 내용이라 Outdated 되었을 수 있으나 도움이 되실지 몰라 남겨 둡니다.


Data / ML Pipeline

  • 데이터가 흘러다니는 파이프라인을 만들 수 있습니다. 수집과 ?장을 넘어 데이터를 서비스에 내보내기 위한 시스템을 AWS 의 다양한 서비스를 이용해 회사 규모에 맞추어 비용 효율?으로 구축? 수 있습니다
  • 로그 포맷을 설계 / 사용 / 관리해온 수년간의 경험을 바탕으로 로그 및 데이터 파이프라인을 올바르게 설계해 추후 시스템의 규모나 비용에 의해 문?가 ? 소지를 미리 ?거? 수 있습니다
  • 데이터를 사람이 사용하기 (SQL, ML) 위한 각종 시스템들을 ?르게 설치하? 규모에 따라 운영? 수 있으며 비즈니스 / MKT 등 다양한 조직의 사람들이 편리하게 데이터를 소비하기 위한 방법들을 ?공? 수 있습니다. 필요? 경우 도구뿐만 아니라 비즈니스에 필요한 데이터를 직? 가공해 최종 ?객까지 ?달하는 수준까지 관여해, 영업 및 비즈니스 확장에 기여해 오? 있습니다
  • 기계학습 등을 위한 ML 인프라를 팀 내 사용자의 스킬셋과 비용을 ??해 ??한 수준에서 구성하? 운영? 수 있습니다. 예를 들어, 모델의 학습과 튜닝을 편리하게 진행? 수 있는 JupyterHub, MLFlow, Viewer 와 같은 도구와 Spark / Dask 같은 다양한 프?임워크를 ?택?으로 사용? 수 있도록 Kubernetes 위에서 ?공해 리소스 탄??으로 운영해온 경험이 있습니다. 또한 ML 엔지니어가 노트북을 쉽게 스케쥴링하? 만들어진 모델을 서빙? 수 있도록 Airflow, BentoML 등의 도구는 물? 커스텀 ?틸리티 ?작을 통해 팀 내 머?러닝 작업의 생산성을 부스팅 ? 수 있습니다.
  • 잘 쌓인 데이터를 서비스에 내보내기 위해 Spark / Flink 등으로 가공? 수 있으며 이를 이용해 통계 / 추천 등 사용자가 마주하는 서비스에 내보낸 경험이 있습니다
  • EMR 내 Presto, Spark, Flink 등과 같은 각종 컴포넌트를 워크로드 및 ?플리케이션 ?형별로 분리해 머? 사이즈 및 특성에 맞는 옵션질 (...) 과 비용?감을 ? 수 있으며 이로 인한 멀티 클러스터 운영을 ?은 물리 노동으로 해낼 수 있습니다. 이외에도 서비스에 필요? 경우 AWS 에서 ?공하지 않는 Druid 와 같은 커스텀 스?리지를 도입해 내부 엔진을 이해하? 직? 관리? 수 있으며, 이를 통해 서비스에 필요항 데이터를 (근) 실시간으로 ?공한 경험이 있습니다

Infrastructure & DevOps

  • AWS Account 를 이?하며 ?체 리소스를 Terraform 으로 빌딩해 옮긴 경험이 있으며 AWS 리소스가 필요? 경우 비용과 용도에 맞추어 Provisioning 하며 Cross Account 이슈를 다룰 수 있습니다
  • 서비스와 데이터 파이프라인에 필요한 AWS 리소스를 다양하게 경험해보았으며, Provisioning 이후 필요한 도구를 설치 및 관리하기 위해 Ansible 을 이용하? 있으며 이를 이용해 다양한 커스텀 스?리지나 서비스를 운영해 오? 있습니다
  • CI/CD 를 위한 ?책을 세우? 필요한 시스템을 세팅 및 운영? 수 있습니다. 과거에는 Jenkins 를 사용했었? 최근에는 AWS 에서 ?공하는 CodeBuild 등의 서비스와 Spinanker 를 조합해 사용하? 있습니다
  • Kubernetes 클러스터를 직? (Kops) 혹은 AWS 서비스 위에서 설치하? 운영? 수 있습니다. AWS EKS 가 도입된 시?부터 1.13 부터 1.21 까지 서비스에 나가거나 데이터 처리를 위한 Self-managed / Managed 클러스터를 다수를 문? 없이 업그?이드 해온 경험이 있습니다.
  • Kubernetes 클러스터를 비용 효율?으로 관리하기 위해 워크로드에 따라 On-demand / Spot 노드를 구성하?, 필요한 리소스에 맞추어 Affinity, nodeLabel 등의 ?책을 세우? 리소스를 ?당? 수 있습니다.
  • Backoffice / API 용도 뿐만 아니라 아니라 데이터 처리용 Kubernetes 클러스터를 별도로 구성하? 운영한 경험이 있습니다
  • Kubernetes Cluster 의 스케일링 / 로깅 / 모니터링 등에 필요한 Add-on 등을 직? 설치 및 관리? 수 있습니다. (EKF, Prometheus, Grafana, Cluster Autoscaler 등)
  • 팀 내 사용자에게 PromQL 또는 AWS Cloudwatch Search Expression 등을 사용해 Grafana 대시보드를 만들어 Kubernetes Cluster / Application (WEB, API) / AWS 리소스에 대한 ?반?인 모니터링과 관리용 뷰를 ?공? 수 있습니다

Service: API & Back Office

  • B2C 서비스로 나가는 통계용 API 와 그 기반 데이터를 개발하? 운영해오? 있습니다
  • API 서버와 Database 를 다루기 위해 JVM 언어 위에서 Spring 과 그 기반 생태계의 라이브러리를 (JPA 등) 주로 사용해 오며 이해도를 높여오? 있으며, 위의 기?로 만들어진 시스템을 모니터링하? 성능을 개?하는 방법을 알? 있습니다
  • 데이터 시스템에 필요한 Back Office 를 여러개 ?작해 왔으며 가장 최근에는 A/B 테스팅을 관리하기 위한 실험 플랫폼 관리 도구의 화면부터 API 까지 ?작했습니다
  • 언??가 본인의 B2C 서비스를 ?작하기 위해 발?하는 WEB 기?들에 대해 학습하? 있으며 해당 내용들을 시스템에 ?용하면서 꾸준히 개?해 오? 있습니다 🙂

Pinned

  1. Jupyter Notebooks for Data Exploit 🙂

    Jupyter Notebook 5 2

  2. Jupyter Notebook Catalog on Kubernetes 😎

    Java 8 5

  3. scala Public

    Scala 32 11

  4. Web-based notebook that enables data-driven, interactive data analytics and collaborative documents with SQL, Scala and more.

    Java 5.5k 2.6k

  5. Get fine-grained Kubernetes + Infrastructure on AWS in 30 mins 🚀

    HCL 68 18

  6. Running JupyterHub on Kubernetes (AWS EKS) in 30 minutes 🔥

    HCL 30 10

184 contributions in the last year

Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Mon Wed Fri

Contribution activity

Seeing something unexpected? Take a look at the GitHub profile guide.