first attempt at setting write-combining with MTRRs. It works, but no
[retrobench] / src / dos / gfx.c
1 #include <stdlib.h>
2 #include <string.h>
3 #include <dos.h>
4 #include "cdpmi.h"
5 #include "gfx.h"
6 #include "vbe.h"
7 #include "vga.h"
8 #include "util.h"
9
10
11 #define SAME_BPP(a, b)  \
12         ((a) == (b) || ((a) == 16 && (b) == 15) || ((a) == 15 && (b) == 16) || \
13          ((a) == 32 && (b) == 24) || ((a) == 24 && (b) == 32))
14
15 void (*blit_frame)(void*, int);
16
17 int resizefb(int x, int y, int bpp, int pitch);
18
19 static void blit_frame_lfb(void *pixels, int vsync);
20 static void blit_frame_banked(void *pixels, int vsync);
21 static uint32_t calc_mask(int sz, int pos);
22
23 static void enable_wrcomb(uint32_t addr, int len);
24 static void print_mtrr(void);
25
26 static struct video_mode *vmodes;
27 static int num_vmodes;
28
29 static int vbe_init_ver;
30 static struct vbe_info vbe;
31
32 /* current mode */
33 static struct video_mode *curmode;
34 static void *vpgaddr[2];
35 static int frontidx, backidx;
36 static int pgcount, pgsize, fbsize;
37
38
39 int init_video(void)
40 {
41         int i, num, max_modes;
42         struct video_mode *vmptr;
43
44         if(vbe_info(&vbe) == -1) {
45                 fprintf(stderr, "failed to retrieve VBE information\n");
46                 return -1;
47         }
48         vbe_print_info(stdout, &vbe);
49
50         num_vmodes = 0;
51         max_modes = 64;
52         if(!(vmodes = malloc(max_modes * sizeof *vmodes))) {
53                 fprintf(stderr, "failed to allocate video modes list\n");
54                 return -1;
55         }
56
57         num = vbe_num_modes(&vbe);
58         for(i=0; i<num; i++) {
59                 struct vbe_mode_info minf;
60
61                 if(vbe_mode_info(vbe.modes[i], &minf) == -1) {
62                         continue;
63                 }
64
65                 if(num_vmodes >= max_modes) {
66                         int newmax = max_modes ? (max_modes << 1) : 16;
67                         if(!(vmptr = realloc(vmodes, newmax * sizeof *vmodes))) {
68                                 fprintf(stderr, "failed to grow video mode list (%d)\n", newmax);
69                                 free(vmodes);
70                                 return -1;
71                         }
72                         vmodes = vmptr;
73                         max_modes = newmax;
74                 }
75
76                 vmptr = vmodes + num_vmodes++;
77                 memset(vmptr, 0, sizeof *vmptr);
78                 vmptr->mode = vbe.modes[i];
79                 vmptr->xsz = minf.xres;
80                 vmptr->ysz = minf.yres;
81                 vmptr->bpp = minf.bpp;
82                 vmptr->pitch = minf.scanline_bytes;
83                 if(minf.mem_model == VBE_TYPE_DIRECT) {
84                         vmptr->rbits = minf.rsize;
85                         vmptr->gbits = minf.gsize;
86                         vmptr->bbits = minf.bsize;
87                         vmptr->rshift = minf.rpos;
88                         vmptr->gshift = minf.gpos;
89                         vmptr->bshift = minf.bpos;
90                         vmptr->rmask = calc_mask(minf.rsize, minf.rpos);
91                         vmptr->gmask = calc_mask(minf.gsize, minf.gpos);
92                         vmptr->bmask = calc_mask(minf.bsize, minf.bpos);
93                         /*vmptr->bpp = vmptr->rbits + vmptr->gbits + vmptr->bbits;*/
94                 }
95                 if(minf.attr & VBE_ATTR_LFB) {
96                         vmptr->fb_addr = minf.fb_addr;
97                 } else {
98                         vmptr->bank_size = (uint32_t)minf.bank_size * 1024;
99                         if(!vmptr->bank_size) {
100                                 vmptr->bank_size = 65536;
101                         }
102                 }
103                 vmptr->max_pages = minf.num_img_pages;
104
105                 printf("%04x: ", vbe.modes[i]);
106                 vbe_print_mode_info(stdout, &minf);
107         }
108         fflush(stdout);
109
110         vbe_init_ver = VBE_VER_MAJOR(vbe.ver);
111         return 0;
112 }
113
114 void cleanup_video(void)
115 {
116         free(vmodes);
117 }
118
119 struct video_mode *video_modes(void)
120 {
121         return vmodes;
122 }
123
124 int num_video_modes(void)
125 {
126         return num_vmodes;
127 }
128
129 struct video_mode *get_video_mode(int idx)
130 {
131         if(idx == VMODE_CURRENT) {
132                 return curmode;
133         }
134         return vmodes + idx;
135 }
136
137 int match_video_mode(int xsz, int ysz, int bpp)
138 {
139         int i, best = -1;
140         struct video_mode *vm;
141
142         for(i=0; i<num_vmodes; i++) {
143                 vm = vmodes + i;
144                 if(vm->xsz != xsz || vm->ysz != ysz) continue;
145                 if(SAME_BPP(vm->bpp, bpp)) {
146                         best = i;
147                 }
148                 if(vm->bpp == bpp) break;
149         }
150
151         if(best == -1) {
152                 fprintf(stderr, "failed to find video mode %dx%d %d bpp)\n", xsz, ysz, bpp);
153                 return -1;
154         }
155         return best;
156 }
157
158 int find_video_mode(int mode)
159 {
160         int i;
161         struct video_mode *vm;
162
163         vm = vmodes;
164         for(i=0; i<num_vmodes; i++) {
165                 if(vm->mode == mode) return i;
166         }
167         return -1;
168 }
169
170 void *set_video_mode(int idx, int nbuf)
171 {
172         unsigned int mode;
173         struct video_mode *vm = vmodes + idx;
174
175         if(curmode == vm) return vpgaddr[0];
176
177         printf("setting video mode %x (%dx%d %d bpp)\n", (unsigned int)vm->mode,
178                         vm->xsz, vm->ysz, vm->bpp);
179         fflush(stdout);
180
181         mode = vm->mode | VBE_MODE_LFB;
182         if(vbe_setmode(mode) == -1) {
183                 mode = vm->mode;
184                 if(vbe_setmode(mode) == -1) {
185                         fprintf(stderr, "failed to set video mode %x\n", (unsigned int)vm->mode);
186                         return 0;
187                 }
188                 printf("Warning: failed to get a linear framebuffer. falling back to banked mode\n");
189         }
190
191         /* unmap previous video memory mapping, if there was one (switching modes) */
192         if(vpgaddr[0] && vpgaddr[0] != (void*)0xa0000) {
193                 dpmi_munmap(vpgaddr[0]);
194                 vpgaddr[0] = vpgaddr[1] = 0;
195         }
196
197         curmode = vm;
198         if(nbuf < 1) nbuf = 1;
199         if(nbuf > 2) nbuf = 2;
200         pgcount = nbuf > vm->max_pages ? vm->max_pages : nbuf;
201         pgsize = vm->ysz * vm->pitch;
202         fbsize = pgcount * pgsize;
203
204         printf("pgcount: %d, pgsize: %d, fbsize: %d\n", pgcount, pgsize, fbsize);
205         printf("phys addr: %p\n", (void*)vm->fb_addr);
206         fflush(stdout);
207
208         if(vm->fb_addr) {
209                 vpgaddr[0] = (void*)dpmi_mmap(vm->fb_addr, fbsize);
210                 if(!vpgaddr[0]) {
211                         fprintf(stderr, "failed to map framebuffer (phys: %lx, size: %d)\n",
212                                         (unsigned long)vm->fb_addr, fbsize);
213                         set_text_mode();
214                         return 0;
215                 }
216                 memset(vpgaddr[0], 0xaa, pgsize);
217
218                 if(pgcount > 1) {
219                         vpgaddr[1] = (char*)vpgaddr[0] + pgsize;
220                         backidx = 1;
221                         page_flip(FLIP_NOW);    /* start with the second page visible */
222                 } else {
223                         frontidx = backidx = 0;
224                         vpgaddr[1] = 0;
225                 }
226
227                 blit_frame = blit_frame_lfb;
228
229                 print_mtrr();
230                 enable_wrcomb(vm->fb_addr, fbsize);
231
232         } else {
233                 vpgaddr[0] = (void*)0xa0000;
234                 vpgaddr[1] = 0;
235
236                 blit_frame = blit_frame_banked;
237         }
238
239         /* allocate main memory framebuffer */
240         if(resizefb(vm->xsz, vm->ysz, vm->bpp, vm->pitch) == -1) {
241                 fprintf(stderr, "failed to allocate %dx%d (%d bpp) framebuffer\n", vm->xsz,
242                                 vm->ysz, vm->bpp);
243                 set_text_mode();
244                 return 0;
245         }
246
247         fflush(stdout);
248         return vpgaddr[0];
249 }
250
251 int set_text_mode(void)
252 {
253         /* unmap previous video memory mapping, if there was one (switching modes) */
254         if(vpgaddr[0] && vpgaddr[0] != (void*)0xa0000) {
255                 dpmi_munmap(vpgaddr[0]);
256                 vpgaddr[0] = vpgaddr[1] = 0;
257         }
258
259         vga_setmode(3);
260         curmode = 0;
261         return 0;
262 }
263
264 void *page_flip(int vsync)
265 {
266         if(!vpgaddr[1]) {
267                 /* page flipping not supported */
268                 return vpgaddr[0];
269         }
270
271         vbe_swap(backidx ? pgsize : 0, vsync ? VBE_SWAP_VBLANK : VBE_SWAP_NOW);
272         frontidx = backidx;
273         backidx = (backidx + 1) & 1;
274
275         return vpgaddr[backidx];
276 }
277
278
279 static void blit_frame_lfb(void *pixels, int vsync)
280 {
281         if(vsync) wait_vsync();
282         memcpy64(vpgaddr[frontidx], pixels, pgsize >> 3);
283 }
284
285 static void blit_frame_banked(void *pixels, int vsync)
286 {
287         int sz, offs;
288         unsigned int pending;
289         unsigned char *pptr = pixels;
290
291         if(vsync) wait_vsync();
292
293         /* assume initial window offset at 0 */
294         offs = 0;
295         pending = pgsize;
296         while(pending > 0) {
297                 sz = pending > curmode->bank_size ? curmode->bank_size : pending;
298                 //memcpy64((void*)0xa0000, pptr, sz >> 3);
299                 memcpy((void*)0xa0000, pptr, sz);
300                 pptr += sz;
301                 pending -= sz;
302                 vbe_setwin(0, ++offs);
303         }
304
305         vbe_setwin(0, 0);
306 }
307
308 static uint32_t calc_mask(int sz, int pos)
309 {
310         uint32_t mask = 0;
311         while(sz-- > 0) {
312                 mask = (mask << 1) | 1;
313         }
314         return mask << pos;
315 }
316
317 #define get_msr(msr, low, high) \
318         asm volatile( \
319                 "\r\trdmsr" \
320                 : "=a"(low), "=d"(high) \
321                 : "c"(msr))
322
323 #define set_msr(msr, low, high) \
324         asm volatile( \
325                 "\r\twrmsr" \
326                 :: "c"(msr), "a"(low), "d"(high))
327
328 #define MSR_MTRRCAP                     0xfe
329 #define MSR_MTRRDEFTYPE         0x2ff
330 #define MSR_MTRRBASE(x)         (0x200 | ((x) << 1))
331 #define MSR_MTRRMASK(x)         (0x201 | ((x) << 1))
332 #define MTRRDEF_EN                      0x800
333 #define MTRRCAP_HAVE_WC         0x400
334 #define MTRRMASK_VALID          0x800
335
336 #define MTRR_WC                         1
337
338 static int get_page_memtype(uint32_t addr, int num_ranges)
339 {
340         int i;
341         uint32_t rlow, rhigh;
342         uint32_t base, mask;
343
344         for(i=0; i<num_ranges; i++) {
345                 get_msr(MSR_MTRRMASK(i), rlow, rhigh);
346                 if(!(rlow & MTRRMASK_VALID)) {
347                         continue;
348                 }
349
350                 get_msr(MSR_MTRRBASE(i), rlow, rhigh);
351                 base = rlow & 0xfffff000;
352                 mask = rlow & 0xfffff000;
353
354                 if((addr & mask) == (base & mask)) {
355                         return rlow & 0xff;
356                 }
357         }
358
359         get_msr(MSR_MTRRDEFTYPE, rlow, rhigh);
360         return rlow & 0xff;
361 }
362
363 static int check_wrcomb_enabled(uint32_t addr, int len, int num_ranges)
364 {
365         while(len > 0) {
366                 if(get_page_memtype(addr, num_ranges) != MTRR_WC) {
367                         return 0;
368                 }
369                 addr += 4096;
370                 len -= 4096;
371         }
372         return 1;
373 }
374
375 static int alloc_mtrr(int num_ranges)
376 {
377         int i;
378         uint32_t rlow, rhigh;
379
380         for(i=0; i<num_ranges; i++) {
381                 get_msr(MSR_MTRRMASK(i), rlow, rhigh);
382                 if(!(rlow & MTRRMASK_VALID)) {
383                         return i;
384                 }
385         }
386         return -1;
387 }
388
389 static void enable_wrcomb(uint32_t addr, int len)
390 {
391         int num_ranges, mtrr;
392         uint32_t rlow, rhigh;
393         uint32_t def, mask;
394
395         if(len <= 0 || (addr | (uint32_t)len) & 0xfff) {
396                 fprintf(stderr, "failed to enable write combining, unaligned range: %p/%x\n",
397                                 (void*)addr, (unsigned int)len);
398                 return;
399         }
400
401         get_msr(MSR_MTRRCAP, rlow, rhigh);
402         num_ranges = rlow & 0xff;
403
404         printf("enable_wrcomb: addr=%p len=%x\n", (void*)addr, (unsigned int)len);
405
406         if(!(rlow & MTRRCAP_HAVE_WC)) {
407                 fprintf(stderr, "failed to enable write combining, processor doesn't support it\n");
408                 return;
409         }
410
411         if(check_wrcomb_enabled(addr, len, num_ranges)) {
412                 return;
413         }
414
415         if((mtrr = alloc_mtrr(num_ranges)) == -1) {
416                 fprintf(stderr, "failed to enable write combining, no free MTRRs\n");
417                 return;
418         }
419
420         mask = len - 1;
421         mask |= mask >> 1;
422         mask |= mask >> 2;
423         mask |= mask >> 4;
424         mask |= mask >> 8;
425         mask |= mask >> 16;
426         mask = ~mask & 0xfffff000;
427
428         printf("  ... mask: %08x\n", (unsigned int)mask);
429
430         disable();
431         get_msr(MSR_MTRRDEFTYPE, def, rhigh);
432         set_msr(MSR_MTRRDEFTYPE, def & ~MTRRDEF_EN, rhigh);
433
434         set_msr(MSR_MTRRBASE(mtrr), addr | MTRR_WC, 0);
435         set_msr(MSR_MTRRMASK(mtrr), mask | MTRRMASK_VALID, 0);
436
437         set_msr(MSR_MTRRDEFTYPE, def | MTRRDEF_EN, 0);
438         enable();
439 }
440
441 static const char *mtrr_names[] = { "N/A", "W C", "N/A", "N/A", "W T", "W P", "W B" };
442
443 static const char *mtrr_type_name(int type)
444 {
445         if(type < 0 || type >= sizeof mtrr_names / sizeof *mtrr_names) {
446                 return mtrr_names[0];
447         }
448         return mtrr_names[type];
449 }
450
451 static void print_mtrr(void)
452 {
453         int i, num_ranges;
454         uint32_t rlow, rhigh, base, mask;
455
456         get_msr(MSR_MTRRCAP, rlow, rhigh);
457         num_ranges = rlow & 0xff;
458
459         for(i=0; i<num_ranges; i++) {
460                 get_msr(MSR_MTRRBASE(i), base, rhigh);
461                 get_msr(MSR_MTRRMASK(i), mask, rhigh);
462
463                 if(mask & MTRRMASK_VALID) {
464                         printf("mtrr%d: base %p, mask %08x type %s\n", i, (void*)(base & 0xfffff000),
465                                         (unsigned int)(mask & 0xfffff000), mtrr_type_name(base & 0xff));
466                 } else {
467                         printf("mtrr%d unused (%08x/%08x)\n", i, (unsigned int)base,
468                                         (unsigned int)mask);
469                 }
470         }
471         fflush(stdout);
472 }