분류 전체보기(120)
-
SRE 발표 및 사례 (구글 / 당근마켓)
1. 구글 클라우드(SRE 로 더 신뢰할 수있는 시스템 구축하기): https://www.youtube.com/watch?v=lxRx_UdTXbU&t=99s 주요 5가지 분야개발자와 운영자간 silo(사일로) 타파 ( 개발자는 새 기능 배포 / 운영자는 안정성 추구 둘간의 의사소통을 촉진하여 사일로 타파)오류를 일상으로 받아들임 : Error Budget 으로 관리 점진적 변화 구현 도구와 자동화 활용모든 것을 측정 : 신뢰성 측정 (SLA) 오류에 대한 대비책을 항상 가지고 있어야 한다.가용성 = 정상 시간 / 총 시간 : 서비스가 작동되고 사용가능한 시간의 비율을 SRE 에선 더 정교한 지표로 아래 방식으로 지표화한다.가용성 = 정상 상호작용(200 OK) / 총 상호작용 : 서비스가 작동되고, ..
2025.11.10 -
자신있게 결정하라
미래를 예측하는데 힘을 쓰지 말라. 우칭 전략 소소한 실험을 통해 내가 세운 가정이 맞는지 검증해본다. ex) 데모버전 만들어보기 , 3개만 판매해보기 -> 우칭을 실행한다는건 이렇게 묻는 것과 같다. 시험 해볼수있는데 왜 예측하지? 알 수있는데 왜 짐작하는거지?A: 충분한 심리적 거리를 확보했는가?1) 101010 기법 10분 후 10개월뒤 10년뒤 지금 선택에 대해 어떤 감정을 느낄지 생각해보라. 2) 만일 나와 가장 가까운 친구가 같은 상황에 처했다면 나는 뭐라고 조언할까?
2025.08.28 -
IAM
IAM 이란? - Identity Access Management: AWS 의 각 서비스에 접근가능한 계정 권한관리해주는 서비스 - 글로벌 서비스다. (리전별에 제한되지 X)- 정책은 JSON 으로 쓰인다. IAM 의 구성 결제 정보 보는법AdminFullAccess 권한을 가진 사용자도 Root 계정이 아니면 Billing 기능에 접근이 불가하다. 가능하게 하려면 아래 "IAM 액세스 활성화"를 해야한다. IAM 자격 증명 보고서 - 계정의 모든 사용자와 암호,엑세스 키, MFA 장치등의 증명상태를 나열하는 보고서를 생성하고 다운로드 가능 - AWS 콘솔, CLI ,API 에서 생성요청및 다운로드 가능 IAM 모범 사용 사례- 루트 사용자는 사용하지 않기: 관리용으로만 쓰고 작업은 IAM U..
2025.04.21 -
한 달에 42시간 절약한 개선 건 (React 빌드 속도 개선 feat.Tekton)
새해 들어 회사에서 한 해 목표를 정하다가Devops 엔지니어의 역할에 대해서 재고하게 되었다. 타 사는 어떻게 하고 있을까 찾아보다가토스의 박서진 개발자분이 빌드 속도를 올리는 것이사내 개발 효율 증진에 큰 도움이 된다는게 인상깊었다.출처: https://www.youtube.com/watch?v=2IE68SDTYvI&t=315s 내 장점은 추진력이니! 바로 사내에서 가장 많이 쓰고 오래걸리는 빌드를 찾아보다React를 쓰는 UI 쪽 빌드 양이 상당한데,빌드시간이 9~10분대인걸 보고 빠르게 개선해드리자는 다짐을 하게되었다! 결론부터 말하면 next 의 빌드 캐시를 이용해 9분 -> 5분대로 줄이는 데 성공하였다. 위 토스에서 본 방식도 써보려했으나, yarn classic(1.x) 에서 ya..
2025.01.25 -
TLS(SSL) 갱신 여부 편하게 확인하기 (쉘 스크립트 자동화)
1년에 1번 바꿔줘야하는 TLS 는 하나씩 바꿀때마다 테스트 해야하는 번거로움이 있다. 운영은 신중하게 본다 쳐도 개발, 검증계도 모두 하나씩 보기엔 과하다는 생각이 들었다. 위처럼 TLS 만료 기한과 DNS 만 깔끔하게 나오도록 쉘 스크립트로 자동화 했다. 사용시 주의 사항 1. DNS 등록한 것만 대상에 넣을 것 www.moon.com 처럼 없는 도메인이나, 접속 안되는 도메인을 쓰면 출력이 안되고 멍때리거나 에러를 내뱉는다. 2. 포트가 443으로 열린거 확실한지 체크하기 아래 포트가 443으로 돼있으나 포트를 다르게 한경우 예외처리를 해줘야 한다. 8443 포트만 열어놨다면 8443 포트로 호출해줘야 한다. Scriptecho "==============prd==============" dnsli..
2024.11.12 -
DNS 트러블슈팅 팁
문제리눅스 서버의 hosts 파일에 DNS A.com를 1 로 ip 를 등록했는데, 잘못돼서 올바른 2 로 수정했다. 근데, 계속 argocd cluster 에 add 하려고 A.com 로 호출하는데 자꾸 1로 뜨는거다. 상태확인dig A.com 으로 보니 1 로 돼있었다.Answer Section 에 첫 parameter 가 3600 이었다. 이는 DNS 캐시 만료시간이 1시간 (3600초) 을 뜻한단다. 1시간 뒤에 해보니 똑같이 1인거다. 처리방법 1그래서 DNS 캐시 flush 를 했다. bind 로 하면 특정 DNS 캐시만 날릴 수있단다. rndc flushname 으로 하니 명령어는 성공했다. 근데, dig A.com 를 다시해도 동일하더라. ping A.com을 해보니, 2 로 나..
2024.10.21