HƯỚNG DẪN SỬ DỤNG NGÔN NGỮ R

Giới thiệuGiới thiệuR không những sử dụng trong những nghiên cứu và điều tra khoa học của cá thể mà còn hoàn toàn có thể san sẻ cho hội đồng, tham gia vào những dự án Bất Động Sản lớn có nhiều người cùng tăng trưởng mã lệnh. Do đó, rèn luyện một phong thái viết mã R trong sáng, đẹp là việc thiết yếu. Bài viết trình diễn 1 số hướng dẫn viết và trình diễn mã nguồn R dựa trên những nguồn sau :

Kinh nghiệm của người viết khi lập trình với các ngôn ngữ khác như Java, C#, Python, … và tham gia các dự án.

Bạn đang xem : Hướng dẫn sử dụng ngôn từ rBài viết trình diễn những điểm mà tác giả thấy quan trọng nhất và dễ thực thi, không yên cầu phải thiết lập thêm những công cụ ứng dụng khác .
Viết và trình bày mã nguồn R

Tổ chức thư mục

Viết và trình diễn mã nguồn R1 dự án Bất Động Sản nghiên cứu và phân tích tài liệu nổi bật không đơn thuần chỉ là viết mã nguồn R mà nó gồm nhiều bước khác nhau với rất nhiều đầu ra, nguồn vào, báo cáo giải trình, kết xuất tài liệu. Khi dự án Bất Động Sản càng lớn thì mức độ phức tạp càng ngày càng tăng. Việc tổ chức triển khai sắp xếp tài nguyên ( hầu hết là file ) trong dự án Bất Động Sản giữ vai trò quan trọng để người tăng trưởng hoàn toàn có thể tìm kiếm truy xuất nhanh gọn tài nguyên mình cần. Tác giả ý kiến đề nghị phương pháp tổ chức triển khai project theo cấu trúc thư mục. Bạn hoàn toàn có thể sử dụng R Project của RStudio. Mỗi một dự án Bất Động Sản được dành riêng cho 1 thư mục. Cấu trúc thư mục hoàn toàn có thể tổ chức triển khai như dưới đây :*Trong đó :data: chứa các tập tin dữ liệu đầu vàofigure: chứa các tập tin hình hoặc data visualization.presentation: chứa các presentation (nếu như bạn dùng rmarkdown để viết presentation).documentation: chứa các documentation (nếu như dùng rmarkdown để viết document).data : chứa những tập tin dữ liệu đầu vàofigure : chứa những tập tin hình hoặc data visualization.presentation : chứa những presentation ( nếu như bạn dùng rmarkdown để viết presentation ). documentation : chứa những documentation ( nếu như dùng rmarkdown để viết document ) .Các file mã nguồn. R hay. Rmd được để ở ngoài những thư mục .

Toán tử gán

Dùng thay vì = khi thực thi phép gán .

# Gooda 5# Bada = 5

Tên biến

Tên biến nên dùng danh từ tiếng Anh, chữ nhỏ – lower case – và sử dụng _ để phân cách giữa các chữ. Tên biến nên gợi mở và liên quan đến bối cảnh của phân đoạn mã, tránh việc đặt tên biến khó hiểu hay cụt ngủn. Đặt tên biến tốt giúp người đọc hiểu nhanh chóng mã nguồn và bám sát tư tưởng của người viết mã. Tên biến tránh trùng lắp với các keyword của R.Tên biến nên dùng danh từ tiếng Anh, chữ nhỏ – lower case – và sử dụng _ để ngăn cách giữa những chữ. Tên biến nên gợi mở và tương quan đến toàn cảnh của phân đoạn mã, tránh việc đặt tên biến khó hiểu hay cụt ngủn. Đặt tên biến tốt giúp người đọc hiểu nhanh gọn mã nguồn và bám sát tư tưởng của người viết mã. Tên biến tránh trùng lắp với những keyword của R .Xem thêm : Tổng Hợp Các Bài Viết Hướng Dẫn Sử Dụng Excel năm nay, Hướng Dẫn Sử Dụng Microsoft Excel Cho Người Mới

# Goodday_oneday_1# Badfirst_day_of_the_monthDayOnedayonedjm1abcchuoi1vector101data.frame

Tên hàm

Tương tự tên biến, tên hàm nên sử dụng động từ tiếng Anh, phân cách giữa các chữ bằng _, chữ nhỏ lower case và tránh sử dụng tên hàm trùng với các tên hàm của package đang sử dụng.

Tương tự tên biến, tên hàm nên sử dụng động từ tiếng Anh, phân cách giữa các chữ bằng _, chữ nhỏ lower case và tránh sử dụng tên hàm trùng với các tên hàm của package đang sử dụng.

# Goodclean_data function(x){ }# BaddataClean function(x){ }

Khoảng trắng (space)

Sử dụng khoảng trắng trước và sau bất kì 1 toán tử nào, thêm 1 khoảng trắng sau dấu phẩy, (tương tự như khi viết tiếng Anh).Sử dụng khoảng chừng trắng trước và sau bất kể 1 toán tử nào, thêm 1 khoảng chừng trắng sau dấu phẩy, ( tương tự như như khi viết tiếng Anh ) .# Goodaverage mean ( feet / 12 + inches, na.rm = TRUE ) # Badaveragemean ( feet / 12 + inches, na.rm = TRUE ) Đối với :, ::, ::: thì hoàn toàn có thể không cần khoảng chừng trắng :# Goodx 1 : 10 base :: get # Badx 1 : 10 base :: getCó thể sử dụng thêm khoảng chừng trắng để canh dòng giúp mã nguồn dễ đọc hơn .list ( total = a + b + c, mean = ( a + b + c ) / n ) Không sử dụng khoảng chừng trắng trobng những đoạn mã lệnh số lượng giới hạn bởi < và >, trừ khi đó là những dấu ,

# Goodif (debug) do(x)diamonds<5, ># Badif ( debug ) do(x) x<1,> x<1 ,>

Viết function khi mã được dùng lại

Trong quá trình viết mã, khi một luồng công việc được lặp đi lặp lại, bạn nên tham số hoá những đoạn code đó và viết thành function. Thói quen này giúp mã nguồn ngắn hơn, dễ quản lý hơn khi nếu điều chỉnh thì chỉ cần điều chỉnh ở 1 nơi.

File mã nguồn

Trong quy trình viết mã, khi một luồng việc làm được lặp đi lặp lại, bạn nên tham số hoá những đoạn code đó và viết thành function. Thói quen này giúp mã nguồn ngắn hơn, dễ quản trị hơn khi nếu kiểm soát và điều chỉnh thì chỉ cần kiểm soát và điều chỉnh ở 1 nơi .File mã nguồn nên được đặt tên theo kiểu chữ thường, giữa những chữ ngăn cách bằng -. Extension của file là. R .# Goodfit-models. Rutility-functions. R # Badfoo. rstuff. rMỗi 1 file R chỉ nên gồm những hoặc đoạn code có mối quan hệ với nhau xét về mặt ngữ nghĩa, không nên viết những file mã lệnh quá dài, gây ra khó khăn vất vả khi người đọc phải scroll lên xuống nhiều để chớp lấy ý tưởng sáng tạo. Nếu như việc thực thi những file diễn ra theo trình tự thì nên đặt số thứ tự cho file :

0-download.R1-parse.R2-explore.R

Trình bày mã code ngay hàng thẳng lối

Soạn mã lệnh cũng như trình bày văn bản, ngay hàng thẳng lối giúp người đọc thoải mái, đồng thời có thể tách bạch được ý tưởng thành từng phân đoạn. Mỗi một dòng mã không nên kéo dài quá hơn 80 kí tự.Soạn mã lệnh cũng như trình diễn văn bản, ngay hàng thẳng lối giúp người đọc tự do, đồng thời hoàn toàn có thể tách bạch được sáng tạo độc đáo thành từng phân đoạn. Mỗi một dòng mã không nên lê dài quá hơn 80 kí tự .function luôn được mở màn và kết thúc với { và } và luôn dùng return ở dòng lệnh gán giá trị trả về, mặc dầu function đó chỉ có 1 lệnh đơn thuần

# Goodcalculate_mean function(x){ return(mean(x))}# Badcalculate_mean function(x) mean(x)long_function_name function(a = “a long argument”, b = “another argument”, c = “another long argument”) { }Gọi 1 function có nhiều tham số

analysis_result analyze ( a = ” a long argument “, b = ” another argument “, c = ” another long argument ” ) hoặc vẽ 1 plot của ggplot với nhiều lớp phức tạpggplot ( dat, aes ( x = rating ) ) + geom_histogram ( binwidth =. 5, colour = ” black “, fill = ” white ” ) + facet_grid ( cond ~. ) + geom_vline ( data = cdat, aes ( xintercept = rating.mean ), linetype = ” dashed “, size = 1, colour = ” red ” ) Khi edit mã, thường sử dụng phím tab để chỉnh sửa. Nếu dựng RStudio, cần thiết lập bước tab là 2 và bảo vệ bấm phím tab thì những khoảng chừng trắng sẽ được thêm vào như thông số kỹ thuật dưới đây :