본문 바로가기
반응형

분류 전체보기135

[Book] 마케팅을 바꾸는 데이터의 힘 | LIM 이 책은 우연히 교보문고에 들렸다가 제목이 마음에 들어서 사 왔던 책이다. 데이터 운영팀에 있으면서 결국 데이터를 관리하고자 하는 목적이 무엇이냐에 대해 생각해 봤을 때 결국 데이터를 통해 유의미한 결과를 도출해 사람들의 유입을 증가시키고 결국 매출을 상승시키고자 하는 것이다. 이 책은 마케팅 분야에서 왜 데이터가 중요하고, 이러한 데이터들을 어떻게 활용해서 비즈니스 목표를 달성시킬 것인가에 대해 전반적으로 설명해주고 있다. 데이터를 아는 마케터가 먼저 성공한다. 목차 1부: 이것이 데이터 마케팅이다. 2부: 빅데이터 대홍수에서 마케터로 살아남기 3부: 소비자를 VIP로 만드는 마케팅의 진화 4부: 데이터는 어떻게 기업의 무기가 되는가 이것이 데이터 마케팅이다. 데이터 마켓팅은 직관과 경험을 넘어서서 정.. 2024. 2. 10.
[Spark] Apache Spark와 RDD | LIM Spark 의 등장 배경 Spark은 대규모 데이터 처리를 위한 오픈소스 분산 컴퓨팅 시스템이다. Spark의 등장 배경은 크게 두 가지 주요 요소에 기반한다. [처리 속도] Hadoop의 MapReduce는 대규모 데이터 처리에 혁명을 가져왔지만, 일부 작업에서는 상대적으로 느린 처리 속도를 보였다. 특히, 반복적인 알고리즘과 실시간 데이터 처리가 필요한 작업에서 이러한 속도 문제가 더욱 도드라졌다. Spark은 이러한 문제를 해결하기 위해 메모리 내(in-memory) 데이터 처리를 통해 빠른 데이터 처리 속도를 제공한다. [다양한 데이터 처리 요구 사항] 데이터 처리의 다양화로 인해 단순히 대량의 데이터를 처리하는 것뿐만 아니라, 실시간 스트리밍 처리, 머신러닝, 그래프 처리 등 다양한 유형의 데이.. 2024. 2. 10.
[Book Review] 데이터 천재들은 어떻게 기획하고 분석할까? | LIM 최근 회사 내에서 tableau 를 이용해 데이터 시각화 작업을 하고 있어서 tableau 관련 책을 빌리러 갔다가 제목이 눈에 띄어 빌려왔던 책이다. 엔지니어로서의 작업도 재밌었지만 현재 이직한 회사로 와서는 실제 데이터를 가지고 어떤 의미를 도출해 낼 수 있는지, 어떤 가설을 입증할 수 있는지에 대해서도 고민을 많이 하고 있고, 이러한 부분에 대해서도 재미를 느끼는 중이다. 이 책은 총 6장으로 이루어져있다. 중간중간 개념적 설명과 더불어 어떻게 분석해야 하는지 자세히 나와 있어서 배경지식이 없다면 읽기 조금 힘들 수는 있으나 나 같은 경우 책을 읽을 때 하나하나 모두 내 머리에 담아야지!로 읽기보다는 나에게 와닿는 내용 필요한 내용만을 취사선택해서 읽고 있다. 데이터로 의사결정하기 위해서는 이전에 .. 2024. 1. 21.
[Book Review] 데이터로 경험을 디자인하라 | LIM 다음 회사를 가기 전 쉴 계기가 생기면서 오래간만에 책을 읽게 되었다. 바로 이 책이다. https://m.yes24.com/Goods/Detail/108802285 데이터로 경험을 디자인하라 - 예스24 ‘기술’이 아닌 ‘의미’가 중요한 경험의 시대 디지털에 남긴 데이터를 통해 고객의 마음을 읽어내는 법 최재붕 교수, 류재철 본부장, 김경서 의장 등 강력 추천 삼성, LG 등 주요 기업들이 ‘ m.yes24.com 들어가기에 앞서 내가 다음에 가는 회사의 부서는 Data Transformation이라는 추세에 따라 약 3-4년 전 신설된 부문으로 알고 있다. 나는 이전까지는 데이터 엔지니어로서 다른 팀에서 필요로 하는 데이터를 요청받으면 수집하고 가공하고 저장하는 역할을 했다. 소위 ETL(ELT) .. 2023. 12. 24.
[회고] 글또를 시작하고, 2023년을 마무리 하며 | LIM 쉼 없이 달려왔던 2023년을 마무리하면서 글또를 시작하게 되었다. 2023년은 살면서 내가 이렇게까지 열심히 살 수 있는 인간이구나를 느꼈던 한 해였다. 일단은 데이터 엔지니어로서 성장하기 위해 가짜연구소 DE4E 스터디를 진행했다. 스터디 내에서 발표도 해보고 사람들과 여러 엔지니어링 관련한 지식을 공유할 수 있었다. https://github.com/Pseudo-Lab/data-engineering-for-everybody GitHub - Pseudo-Lab/data-engineering-for-everybody: DE4E: Data Engineering for Everybody by Pseudo-Lab DE4E: Data Engineering for Everybody by Pseudo-Lab - .. 2023. 12. 10.
[dbt] 쿼리 결과를 변수에 저장하고 싶은 경우 | LIM dbt 내부에서 쿼리 결과를 변수로 지정하고 싶을 때에는 run_query 를 사용하면 된다. 다음과 같이 사용할 수 있다. 각 쿼리는 6개월 동안의 달의 첫 번째 날짜와, 마지막 날짜를 가져오는 쿼리이다. {% set get_start_date %} select format_date('%Y-%m-01', date_sub(current_date('Asia/Seoul'), interval seq month)) from unnest(generate_array(1, 6)) as seq {% endset %} {% set get_end_date %} select format_date('%Y-%m-%d', last_day(date_sub(current_date('Asia/Seoul'), interval seq m.. 2023. 12. 6.
반응형