본문 바로가기

분류 전체보기

(71)
Windows 11 Git Setup Git 설치 https://git-scm.com/download/win Git - Downloading Package Download for Windows Click here to download the latest (2.44.0) 32-bit version of Git for Windows. This is the most recent maintained build. It was released about 2 months ago, on 2024-02-23. Other Git for Windows downloads Standalone Installer 32-bit Git git-scm.com 위 링크에 들어가서 가장 위쪽에 표시되어 있는 'Click here to download'를 눌러서 설치 패키지를 ..
Windows 11 WSL Ubuntu Setup 이번 포스팅에서는 Windows 11에서 Linux 환경을 셋업하기 위해 WSL (Windows Subsystem for Linux) Ubuntu를 설치하는 과정을 다룬다. 설치 가능한 WSL 목록 확인 Windows Powershell을 관리자 권한으로 실행한 뒤, 아래 명령어를 입력하여 설치 가능한 wsl 목록을 확인한다. wsl --list --online WSL 설치하기 원하는 배포 판을 명시하여 WSL을 설치한다. 여기서는 가장 최신 버전인 Ubuntu-22.04를 설치한다. 다운로드를 마치면 안내에 따라 Windows 시스템을 재부팅한다. Ubuntu 초기 셋업 아래와 같은 화면이 나오면 username을 입력한다. password 설정을 이어서 해주면 셋업이 끝난다.
[Micro '23] K. Kanellopoulos, Victima: Drastically Increasing Address Translation Reachby Leveraging Underutilized Cache Resources 1 Background 1.1 Virtual memory & Page table (PT) Virtual memory designs allow any mapping from a virtual page to a physical page. The OS keeps a PT, which is a per-process data structure that records the virtual-to-physical mapping of the process. The PT is organized as a 4-level radix tree as shown in Figure 1, and the system sequentially accesses each level to find the corresponding phyiscal ..
[ISCA '21] A. Naithani, Vector Runahead 1 Motivation & Key Idea 1.1 Background: Memory stalls in OoO processors When a load instrcution misses the last level cache (LLC), the instruction often becomes the head of the reorder buffer (ROB), causing the processor to stall due to the full instruction window. This stall typically lasts for tens to hundreds of cycles, and becomes one of the main bottleneck for performance. 1.2 Motivation: L..
[HPCA '03] O. Mutlu, Runahead Execution 1 Motivation & Key Idea 1.1 Instruction window in OoO processor Out-of-Order (OoO) execution can tolerate long-latency cache misses better than in-order execution by scheduling subsequent instructions that are independent of the miss. A long-latency operation blocks the instruction window, even if subsequent instructions have completed execution. It is because the insturction window should ensur..
[NeurIPS '22] X. Wei, Outlier Suppression: Pushing the Limit of Low-bit Transformer Language Models 1 Introduction Transformer-based model의 memory, computation overhead를 낮추고자 low-precision arithmetic을 사용하는 quantization이 많이 연구되어 오고 있다. Transformer-based model은 outlier가 존재하며 이들은 구조화된 패턴 (예를 들어, 특정한 embedding dimension에 모여있다든지)을 보임이 알려져 있다. Outlier의 존재는 quantization performance에 심각한 damage를 가져오며, 기존의 접근법 중 하나로는 quantization granularity를 보다 finer하게 가져가는 것이 있는데, 이는 오히려 computation cost를 증가시키는 한계점이 ..
[Review] G. Vavouliotis, "Page Size Aware Cache Prefetching", Micro 2022 1 Brief Summary 1.1 Motivation Existing cache prefetchers keep track of metadata structures (for example, history table) in units of 4KB pages and stop prefetching if the predicted delta exceeds the 4KB page boundary. This is because going beyond the 4KB boundary doesn't assure physical contiguity. Cache prefetchers typically reside below the L2 hierarchy, where the address translation is alread..
tmux customize 하여 사용하기 tmux를 사용하면 session을 한 번 만들어두고 나중에 다시 사용할 때 해당 session에서 이어서 작업할 수 있다. 또한 window를 여러 개 만들어서 vim 작업, 프로그램 실행 등 여러 작업을 편리하게 왔다갔다 하면서 할 수 있다. Tutorial link for 'tmux' 아래 링크에 tmux의 사용법이 잘 정리되어 있다. 참고 링크: https://hbase.tistory.com/200 [Linux] tmux 설치와 사용법 및 예제 정리 원격 서버에 접속해서 작업을 하다보면 터미널 화면을 분할해서 사용해야하는 경우가 많다. 특히 하나의 터미널 창에 여러개의 터미널 화면을 분할해서 사용하는 'Terminal multiplexer'라는 종류의 hbase.tistory.com How to ..